程序包 hust.cs.javacourse.search.util
hust.cs.javacourse.search.util包里实现了一些工具类,学生可以参考和直接使用.具体包括:
Config:索引构建和搜索的配置信息
StopWords:停用词表
StringSplitter:将字符串分割成一个个的单词
FileUtil:读写文本文件
-
类概要 类 说明 Config 保存搜索引擎的配置信息,例如: 索引文件所在目录 要建立索引的文本文件所在目录 构建索引时是否忽略单词大小写 分词所需要的正则表达式 基于正则表达式的三元组过滤器所需的正则表达式 基于单词长度的三元组过滤器所需的最小单词长度和最大单词长度 ...FileUtil 文件操作的工具类StopWords 停用词表类StringSplitter 字符串分割类,根据标点符号和空白符将字符串分成一个个单词