类的使用
hust.cs.javacourse.search.parse.AbstractTermTupleStream
| 程序包 | 说明 |
|---|---|
| hust.cs.javacourse.search.index |
hust.cs.javacourse.search.index包里定义了和倒排索引数据结构相关的抽象类,以及和索引构建相关的抽象类和接口.
|
| hust.cs.javacourse.search.index.impl |
对hust.cs.javacourse.search.index包里定义的抽象类和接口的具体实现放在这个包里。
|
| hust.cs.javacourse.search.parse |
hust.cs.javacourse.search.parse包里定义了文档解析、分词,单词过滤有关的抽象类.学生需要实现这些抽象类的具体子类
|
| hust.cs.javacourse.search.parse.impl |
对hust.cs.javacourse.search.parse包里定义的抽象类和接口的具体实现放在这个包里。
|
-
hust.cs.javacourse.search.index中AbstractTermTupleStream的使用
参数类型为AbstractTermTupleStream的hust.cs.javacourse.search.index中的方法 修饰符和类型 方法 说明 abstract AbstractDocumentAbstractDocumentBuilder. build(int docId, java.lang.String docPath, AbstractTermTupleStream termTupleStream)由解析文本文档得到的TermTupleStream,构造Document对象. -
hust.cs.javacourse.search.index.impl中AbstractTermTupleStream的使用
参数类型为AbstractTermTupleStream的hust.cs.javacourse.search.index.impl中的方法 修饰符和类型 方法 说明 AbstractDocumentDocumentBuilder. build(int docId, java.lang.String docPath, AbstractTermTupleStream termTupleStream)由解析文本文档得到的TermTupleStream,构造Document对象. -
hust.cs.javacourse.search.parse中AbstractTermTupleStream的使用
hust.cs.javacourse.search.parse中AbstractTermTupleStream的子类 修饰符和类型 类 说明 classAbstractTermTupleFilter抽象类AbstractTermTupleFilter类型是AbstractTermTupleStream的子类,里面包含另一个 AbstractTermTupleStream对象作为输入,并对输入的AbstractTermTupleStream进行过滤, 例如过滤掉所有停用词(the,is are...)对应的三元组 其具体子类需要重新实现next方法以过滤掉不需要的单词对应的三元组.同时可以实现多个不同的过滤器 完成不同的过滤功能,多个过滤器可以形成过滤管道.classAbstractTermTupleScannerAbstractTermTupleScanner是AbstractTermTupleStream的抽象子类,即一个具体的TermTupleScanner对象就是 一个AbstractTermTupleStream流对象,它利用java.io.BufferedReader去读取文本文件得到一个个三元组TermTuple.声明为AbstractTermTupleStream的hust.cs.javacourse.search.parse中的字段 修饰符和类型 字段 说明 protected AbstractTermTupleStreamAbstractTermTupleFilter. inputFilter的输入,类型为AbstractTermTupleStream参数类型为AbstractTermTupleStream的hust.cs.javacourse.search.parse中的构造器 构造器 说明 AbstractTermTupleFilter(AbstractTermTupleStream input)构造函数 -
hust.cs.javacourse.search.parse.impl中AbstractTermTupleStream的使用
hust.cs.javacourse.search.parse.impl中AbstractTermTupleStream的子类 修饰符和类型 类 说明 classLengthTermTupleFilterclassPatternTermTupleFilterclassStopWordTermTupleFilterclassTermTupleScannerTermTupleScanner是一个AbstractTermTupleStream流对象, 它利用java.io.BufferedReader去读取文本文件得到一个个三元组TermTuple.参数类型为AbstractTermTupleStream的hust.cs.javacourse.search.parse.impl中的构造器 构造器 说明 LengthTermTupleFilter(AbstractTermTupleStream input)构造函数PatternTermTupleFilter(AbstractTermTupleStream input)构造函数StopWordTermTupleFilter(AbstractTermTupleStream input)构造函数