前嗅网络发表于2022年2月22日16:22最后回复于2022年2月22日16:22

爬虫常见采集场景:通过搜索引擎采集公开联系方式

665浏览量

0评论

ForeSpider数据采集分析引擎,可以通过设定海量关键词,通过搜索引擎采集特定事件、企业相关的内容,并挖掘其联系方式、时间、地点等信息。

案例:

1.采集各类比赛主办方信息

在ForeSpider爬虫软件中,通过设定各类比赛的关键词,如“创业大赛”、“摄影比赛”采集某表演比赛所有报名公告内容,并挖掘其中的主办方的主体信息和联系电话。

2.通过企业名称采集招聘信息

在ForeSpider爬虫软件中,通过从其他平台采集到的企业名称关键词列表,在百度搜索引擎上采集企业的全部招聘公告,并挖掘其中的HR联系电话。

3.采集特定行业的企业官网

在ForeSpider爬虫软件中,通过设定特定行业的关键词,在搜索引擎上不断自动翻页,采集检索列表中的企业官网,在企业官网的全部文本中,通过前嗅独创的智能挖掘文本,挖掘网站底部或联系方式页中的联系电话。

4.采集研究生导师联系方式

通过考研平台上采集到的各个高校研究生导师的姓名,通过搜索引擎采集各个高校的各学院官网,采集研究生导师的联系方式。


私信

举报