网站采集器MetaSeeker v4.x速成手册

MetaSeeker号称最容易使用的网站采集器,用户不用阅读目标网页的HTML源代码、不用理解HTML标签、不用懂正则表达式,只需要鼠标操作或者输入存储数据的字段名即可,采集规则自动生成。

然而以前的手册多以文字为主,不够直观,因此,本手册将以屏幕截图为主一步步讲解各种操作场景,帮助用户快速上手,而《MetaStudio用户手册》《DataScraper用户手册》可以作为进修教材,以便深入了解MetaSeeker的工作原理。当然,在跟着本手册的步骤操作MetaSeeker之前,首先要安装免费的MetaSeeker在线版客户端软件:MetaStudio和DataScraper,下面第一个截图教材讲解怎样安装如下两个客户端软件:

  • MetaStudio是网站采集规则自动生成工具,用户用鼠标指定哪些数据需要从网页上采集下来,MetaStudio自动生成采集规则。采集规则存储在MetaSeeker服务器上,用户不管换用哪台计算机或者走到哪,都可以使用MetaSeeker网站采集云中的规则。
  • DataScraper是网站采集器执行单元,是一个网络爬虫,将网络上的数据采集下来,同时利用MetaStudio生成的采集规则,精确地提取需要的字段并存储在XML文件中。

下面我们开始MetaSeeker体验之旅。