类 Config

java.lang.Object
hust.cs.javacourse.search.util.Config

public class Config
extends java.lang.Object

 保存搜索引擎的配置信息,例如:
      索引文件所在目录
      要建立索引的文本文件所在目录
      构建索引时是否忽略单词大小写
      分词所需要的正则表达式
      基于正则表达式的三元组过滤器所需的正则表达式
      基于单词长度的三元组过滤器所需的最小单词长度和最大单词长度
      ...
 
  • 字段概要

    字段 
    修饰符和类型 字段 说明
    static java.lang.String DOC_DIR
    文本文件的目录,以相对路径指定文本文件目录 ,将文本文件保存在当前工程目录下的text子目录中 这样做的好处:文本文件目录是相对路径,无论你把整个工程放在什么位置,程序都可以正常运行.
    static boolean IGNORE_CASE
    构建索引和检索时是否忽略单词大小写
    static java.lang.String INDEX_DIR
    索引文件的目录,以相对路径指定索引文件目录,将索引文件保存在当前工程目录下的index子目录中.
    static java.lang.String PROJECT_HOME_DIR
    Java工程HOME目录, System.getProperty("user.dir")返回当前JAVA工程目录
    static java.lang.String RESULT_DIR
    命中文档结果的目录,以相对路径指定命中文档文件目录,将命中文档文件保存在当前工程目录下的result子目录中.
    static java.lang.String STRING_SPLITTER_REGEX
    将字符串切分成单词时所需的正则表达式.
    static int TERM_FILTER_MAXLENGTH
    基于单词的最小长度过滤单词.
    static int TERM_FILTER_MINLENGTH
    基于单词的最小长度过滤单词.
    static java.lang.String TERM_FILTER_PATTERN
    单词过滤的正则表达式.
  • 构造器概要

    构造器 
    构造器 说明
    Config()  
  • 方法概要

    从类继承的方法 java.lang.Object

    clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
  • 字段详细资料

    • PROJECT_HOME_DIR

      public static java.lang.String PROJECT_HOME_DIR
      Java工程HOME目录, System.getProperty("user.dir")返回当前JAVA工程目录
    • INDEX_DIR

      public static java.lang.String INDEX_DIR
       索引文件的目录,以相对路径指定索引文件目录,将索引文件保存在当前工程目录下的index子目录中.
       这样做的好处:索引文件目录是相对路径,无论你把整个工程放在什么位置,程序都可以正常运行.
       
    • RESULT_DIR

      public static java.lang.String RESULT_DIR
       命中文档结果的目录,以相对路径指定命中文档文件目录,将命中文档文件保存在当前工程目录下的result子目录中.
       
    • DOC_DIR

      public static java.lang.String DOC_DIR
        文本文件的目录,以相对路径指定文本文件目录 ,将文本文件保存在当前工程目录下的text子目录中
        这样做的好处:文本文件目录是相对路径,无论你把整个工程放在什么位置,程序都可以正常运行.
       
    • IGNORE_CASE

      public static boolean IGNORE_CASE
      构建索引和检索时是否忽略单词大小写
    • STRING_SPLITTER_REGEX

      public static java.lang.String STRING_SPLITTER_REGEX
       将字符串切分成单词时所需的正则表达式.
       例如根据中英文的逗号,分号,句号,问号,冒号,感叹号,中文顿号,空白分割符进行切分
       
    • TERM_FILTER_PATTERN

      public static java.lang.String TERM_FILTER_PATTERN
       单词过滤的正则表达式.
       例如正则表达式指定只保留由字母组成的term,其他的term全部过滤掉,不写入倒排索引
       
    • TERM_FILTER_MINLENGTH

      public static int TERM_FILTER_MINLENGTH
       基于单词的最小长度过滤单词.
       例如指定最短单词长度为3,长度小于3的单词过滤掉,不写入倒排索引
       
    • TERM_FILTER_MAXLENGTH

      public static int TERM_FILTER_MAXLENGTH
       基于单词的最小长度过滤单词.
       例如指定最长单词长度为20,长度大于20的单词过滤掉,不写入倒排索引
       
  • 构造器详细资料