网页数据抓取/网络爬虫软件工具包MetaSeeker的最大优势(免费使用除外)在于全图形化界面操作,避免人为编写网页数据抓取规则而引入错误,而且提供了一套流水线式的网页数据抓取规则定义方法,问题可以即时发现、即时纠正、纠正效果即时验证。因此,极大提高了网页数据抓取规则定义效率,可以在几分钟之内为某个样本页面制作好抓取规则。本章前几节讲解流水线式的操作方式,本节讲解怎样查看日志确定网页数据抓取规则的正确性。
在MetaStudio生成网页数据抓取指令文件时,可能因为指定的映射关系不合理或者数据不完整,造成指令文件无法正确生成。在这种情况下,会在输出窗口中的出错信息标签页中显示遇到的问题。如果发生了错误,即使指令文件生成了,建议不要使用。
注意:一些严重的错误用Alert提示框即时提示用户,而且终止计算过程。