前嗅网络发表于2022年3月2日10:58最后回复于2022年3月2日10:58

收到模板后,如何采集数据?

228浏览量

0评论

①导入配置文件

打开软件,从“文件”菜单导入采集文件,打开“***.spack”。

                               

②采集预览

由于要求采集仓储用途和物流用途的招投标信息,所以采集预览的时候最后一页没有出现数据,说明该页面为其他用途的招标信息,爬虫将不予采集。

 

 

③数据建表

 

④关联表单

在新建的表单前打上对勾,与采集模板关联。

 

 

⑤选择采集速度

可以在“数据采集”中“运营设置”中,增加线程数目。

 

 

 

⑥选择需要采集的频道

关闭不需要采集的频道。空白的蓝色图标表示频道采集关闭了,灰色对勾图表表示开启。

(列表中的频道较多时,可从根节点整体关闭,再只开启本频道。)

保证只有需要采集的频道状态是“采集”。将其他的频道设置为“不采集”。

 

 

 

⑦开始采集

 

 

⑧浏览数据

采集一段时间后,点击“停止”按钮,停止采集。或等数据采集完自动停止。

切换到“数据浏览”选项卡,在数据列表中选择该数据表,点击“刷新”,右侧可以看到数据表中的数据结果。(不停止采集也可以查看数据结果)

 

⑨导出数据

点击导出数据按钮,如下图所示:

 

选择路径,点击确定,即可导出。


私信

举报