提取信息

提取Web页面信息时,首先要在主题列表中找到目标主题,然后在主题列表中选中的主题上通过右键菜单启动提取任务。

浏览和查询主题信息有两种方法:

  1. 在DataScraper左栏的主题列表上,点击鼠标右键,选择“List”菜单,可以浏览所有主题信息。
  2. 在主题列表栏的下部有个输入框,输入主题名或者带有通配符“*”的字符串,回车后就可以罗列出所有符合条件的主题信息。

如果信息很多,将分页显示,翻页查找到主题ComList_ali后,选择该记录(背景显示成蓝色),在主题列表上点击鼠标右键,选择“Crawl”菜单,在弹出对话框中输入要爬行的线索数,提交后,DataScraper将一页一页地加载目标页面并提取信息。

可以在选中的主题上点鼠标右键,选择“Statistics”菜单,查看该主题的信息提取(页面抓取/抽取)线索的状态和数量统计。