6.2.3 加载日志宏

核心产品

数据采集

自然语言处理

数据分析

大数据配套服务

数据治理

大数据引擎

大数据应用

消费品分析报告

行业分析报告

跨境电商分析报告

大数据底层技术

ForeSpider软件

ForeSpider下载

ForeSpider功能列表

ForeSpider产品优势

采集服务

软件学习

图文教程

视频教程

脚本教程

采集模板下载

新闻媒体类

电商平台类

企业信息类

智能分析

特征提取

智能计算

数据可视化

数据分析应用

消费品分析报告

行业分析报告

跨境电商报告

定制智能分析报告

预荐云数据系统

行业竞品分析

电商快消品分析

搜索引擎排名分析

系统集成服务

系统定制开发

营销方案定制

云服务器

代码工具

时间戳转换工具

进制转换工具转码工具

px转换vw

颜色转换

Json格式化工具

Base64转码

编码转换

邮箱加密

Excel/csv数据转json格式工具

压缩和格式化工具

推算日期及计算日期差

密码生成器

个人所得税计算

去除重复项

字数统计工具

html转换成其它语言

面积单位换算

摩斯密码翻译器

vw和px之间的批量转换

正则表达式在线代码生成工具

智能数据中台

行业解决方案

通用解决方案

数据解决方案

金融方案

制造业&物流

企业数字化

医疗方案

政务方案

实时监测

智能分析

数据智能挖掘

全网自动采集

场景智慧采集

主题识别采集

微信登录
账号登录
手机号登录

扫码立即登录

忘记密码？没有账号立即注册

发送

咨询电话(周一至周五9：00-18：00)

022-2345 2937

185 2247 0110

business@forenose.com

QQ：2779623375

用户QQ群3：606835039

用户QQ群4：795287153

订阅号

服务号

客服微信:qianxiu0106

ForeSpider

数据采集引擎

免费下载

教程列表

搜索

6.2.3 加载日志宏

视频教程：模板下载：

筛选符合条件的日志，对采集策略进行补充。通过加载日志宏，可以更加精确的确定下次采集的范围。

【加载日志宏】

支持语法如下：

1.size：网页大小

一般网页大小过小的网页，往往是被识别反爬后重定向了，但采集状态仍然是正确（绿色）的。重采时可以筛选出质量小于一定大小的网页进行重复采集。

例如，加载所有网页大小小于1k的日志：size<1024

如果采集状态是ok，但是页面大小小于1kb，可能是被识别反爬后重定向了，重采时可以筛选出质量小于一定大小的网页进行重复采集。如验证码跳出，则采集到的为验证码内容就不会采集正常的网页内容了。

2.id：网页ID

通过规定网页ID可以补采某一部分网页，比如认为数据从哪部分之后有问题了，就补采大于这个网页ID的日志部分。

例如，加载网页大小小于10k并且网页Id大于100的日志：size<10240 and id>100

3.pid：来源ID