客户信息采集

Customer Information Collection

  • 采集海量网站信息

    01判断是否需要登录

    在采集企业客户信息时,我们可以选择相应的企业黄页类网站采集,部分网站可能需要登录才能查看, 对于需要登录的网站,我们需要配置登录设置。

    02配置流程

    通过行业列表查找二级分类,进入列表页采集相关企业信息。第一步:通过行业列表进入,需要先抽取相关行业链接,我们以“五金行业”为例,如下图所示:

    02配置流程

    第二步:由链接进入后,我们根据网站内对于省市的划分,查找相应采集规律进行设置,找到相应链接,如下图所示:

    02配置流程

    第三步:由于采集列表页需要翻页,所以需要设置抽取翻页链接,翻页链接的抽取也需要脚本实现。翻页链接如下图所示:

    02配置流程

    第四步:链接获取到之后需要获取数据:

    03可以获取到列表页的信息

    可以获取到的数据字段为图中圈起来的字段,公司名、主营产品、公司简介、联系电话、联系人、公司位置等都可以获取。