所有类

说明
AbstractDocument
AbstractDocument是文档对象的抽象父类.
AbstractDocumentBuilder
AbstractDocumentBuilder是Document构造器的抽象父类.
AbstractHit
AbstractHit是一个搜索命中结果的抽象类.
AbstractIndex
AbstractIndex是内存中的倒排索引对象的抽象父类.
AbstractIndexBuilder
AbstractIndexBuilder是索引构造器的抽象父类 需要实例化一个具体子类对象完成索引构造的工作
AbstractIndexSearcher
AbstractIndexSearcher是检索具体实现的抽象类
AbstractIndexSearcher.LogicalCombination
多个检索词的逻辑组合
AbstractPosting
AbstractPosting是Posting对象的抽象父类.
AbstractPostingList
AbstractPostingList是所有PostingList对象的抽象父类.
AbstractTerm
AbstractTerm是Term对象的抽象父类.
AbstractTermTuple
AbstractTermTuple是所有TermTuple对象的抽象父类.
AbstractTermTupleFilter
抽象类AbstractTermTupleFilter类型是AbstractTermTupleStream的子类,里面包含另一个 AbstractTermTupleStream对象作为输入,并对输入的AbstractTermTupleStream进行过滤, 例如过滤掉所有停用词(the,is are...)对应的三元组 其具体子类需要重新实现next方法以过滤掉不需要的单词对应的三元组.同时可以实现多个不同的过滤器 完成不同的过滤功能,多个过滤器可以形成过滤管道.
AbstractTermTupleScanner
AbstractTermTupleScanner是AbstractTermTupleStream的抽象子类,即一个具体的TermTupleScanner对象就是 一个AbstractTermTupleStream流对象,它利用java.io.BufferedReader去读取文本文件得到一个个三元组TermTuple.
AbstractTermTupleStream
AbstractTermTupleStream是各种TermFreqPosTupleStream对象的抽象父类 TermFreqPosTupleStream是三元组TermTuple流对象,包含了解析文本文件得到的三元组序列
Config
保存搜索引擎的配置信息,例如: 索引文件所在目录 要建立索引的文本文件所在目录 构建索引时是否忽略单词大小写 分词所需要的正则表达式 基于正则表达式的三元组过滤器所需的正则表达式 基于单词长度的三元组过滤器所需的最小单词长度和最大单词长度 ...
Document  
DocumentBuilder  
FileSerializable
定义文件序列化接口
FileUtil
文件操作的工具类
Hit  
Index
AbstractIndex的具体实现类
IndexBuilder  
IndexSearcher  
LengthTermTupleFilter  
PatternTermTupleFilter  
Posting  
PostingList  
SimpleSorter  
Sort
Sort定义了对搜索结果排序的接口
StopWords
停用词表类
StopWordTermTupleFilter  
StringSplitter
字符串分割类,根据标点符号和空白符将字符串分成一个个单词
Term  
TermTuple  
TermTupleScanner  
TestBuildIndex
测试索引构建
TestSearchIndex
测试搜索