DataScraper v3.x用户手册

DataScraperWeb页面信息提取工具,利用MetaStudio生成的信息提取指令文件,对属于相同语义类别的页面信息进行连续提取,生成XML格式的信息提取结果文件,并将信息提取结果文件存储在本地目录DataScraperWorks

DataScraper是信息提取工具包MetaSeeker的四个工具软件其中一个。

本版本是上一个版本的简化版,除了对功能进行精简以外,操作方法几乎没有改变,V2.0用户只要注意以下变化,几乎可以不必阅读本手册

  • 信息提取结果存储在本地主目录下的DataScraperWorks目录下,例如,MS Windows用户xpuser提取到的结果存放在C:\Users\xpuser\DataScraperWorks\目录下。
  • 由于信息提取结果不再存储到DataStore服务器上了,DataScraper的结果文件管理工具被删除了。
  • 基于相同原因,DataScraper的Lucene索引库管理工具也被删除了。