Index Manager

Index Manager功能部件是一个管理Lucene V2.3.2索引的工具

DataStore服务器集成了Lucene v2.3.2搜索引擎,Index Manager可以管理和控制Lucene,对信息提取(页面抓取/抽取)结果进行索引,并且能够规定提取到的信息属性的索引的权重、是否作为关键字以及是否存储等。使用这个搜索引擎,用户将提取的结果文件建立索引库,方便用户检索结果文件。

在DataStore服务器上使用了StandardAnalyzer,该文本分析工具功能强大,支持中文,但是只支持一元分词(即分成一个个字),另外,由于支持IP地址的识别,如果一行文本是Thinking.in.Java.rar,是作为一个词进行索引的。