DataScraper v2.0 用户手册

DataScraperWeb页面信息提取(网页抓取/抽取)工具,利用MetaStudio生成的信息提取指令文件,对属于相同语义类别的页面信息进行连续提取,生成XML格式的信息提取结果文件,并将信息提取结果文件存储在DataStore服务器中。DataScraper提供基于图形界面(GUI)的结果文件管理工具和Lucene v2.3.2索引库管理工具。

DataScraper是信息提取(网页抓取/抽取)工具包MetaSeeker的四个工具软件其中一个。