• 新闻类

  • 论坛类

新闻类网站舆情采集

Public Opinion Collection of News Websites

采集新闻类网站,可以有效了解各个行业及社会的舆论导向,如金融类的舆情网站,以及其他热点新闻舆情等。

  • 通过关键词搜索获取新闻列表

    01判断是否需要关键词搜索

    通过关键词搜索,需由用户准备好关键词,关键词即为在网站中搜索的搜索词,如关键词为“大数据”, 通过ForeSpider的关键词采集功能,采集相关商品信息,如图所示:

    02判断是否需要登录

    采集金融新闻资讯,一般不需要登录,具体情况需要在采集的过程中判断。

    03配置流程

    第一步:在软件里面配置好关键词,并过滤关键词为“大数据”链接。

    03配置流程

    第二步:由于采集列表页需要翻页,所以需要设置抽取翻页链接。翻页链接如 下图所示:

    03配置流程

    第三步:链接获取到之后需要获取数据:

    04可以获取到的信息

    可以获取到的数据如图:
  • 通过子栏目采集新闻数据

    01判断是否需要登录

    采集金融新闻资讯,一般不需要登录,具体情况需要在采集的过程中判断。

    02配置流程

    第一步:通过ForeSpider的链接抽取功能,采集相关子栏目,如图所示:

    02配置流程

    第二步:在子栏目中抽取新闻链接以及翻页链接,如下图所示:

    02配置流程

    第三步:获得新闻链接后,后续操作均与通过关键词搜索后续操作一致,可参考上述操作继续进行。

    03可以获取到的信息

论坛类网站舆情采集

Public Opinion Collection of Forum Websites

公司相关舆论信息,可以通过关键词搜索,对某些论坛、微博等自自媒体网站进行监控。

  • 论坛类采集

    01判断是否需要关键词搜索

    关键词即为在网站中搜索的搜索词。如果需要通过关键词搜索,则需由用户准备好关键词,如关键词为“前嗅”, 通过ForeSpider的关键词采集功能,采集相关舆论信息,如图所示:

    02配置流程

    第一步:在软件里面配置好关键词为“前嗅”并获取到与“前嗅”有关的链接作为入口地址。

    03配置流程

    第二步:获取到关键词为“前嗅”的链接之后,需要获取翻页链接,如下图所示:

    03配置流程

    第三步:可以获取每一页中,与“前嗅”关键词相关舆论的链接,如下图所示:

    03配置流程

    第四步:获取内容信息及每条跟帖信息,如下图所示:

    04可以获取到的信息