虽然分析过程用于索引和查询,但并不要求对两种操作使用相同的分析过程。对于索引,您通常希望简化或规范化单词。例如,将所有字母设置为小写,消除标点符号和重音符号,将单词映射到它们的词干等等。这样做可以提高召回率,因为例如,“ram”、“Ram”和“RAM”都将匹配对“ram”的查询。为了提高查询时的准确性,过滤器可以通过缩小匹配范围来缩小匹配范围,例如,如果您对公羊感兴趣,而不是随机存取内存,则忽略所有大写的首字母缩写词。
分析过程输出的标记定义了该字段的值或术语,并用于在添加新文档时构建这些术语的索引,或识别哪些文档包含您正在查询的术语。
以下部分将向您展示如何配置字段分析器,并且还可以作为配置每个可用的分词器和过滤器类的详细信息的参考。它还可以作为指南,以便在您有特殊需求,而包含的过滤器或分词器无法满足时,您可以配置自己的分析类。