土耳其语分析器(Turkish)

Turkish 分析器 #

turkish 分析器是为土耳其语文本特别设计的语言分析器,使用土耳其语专用的小写转换。

分析器组成 #

该分析器由以下分词器和分词过滤器组成:

  • standard 分词器:标准的文本分割
  • apostrophe 分词过滤器:移除撇号及其后字符
  • turkish_lowercase 分词过滤器:土耳其语专用小写转换(正确处理 İ/I)
  • stop 分词过滤器:过滤土耳其语停用词
  • snowball(Turkish) 分词过滤器:土耳其语词干提取

示例 #

POST _analyze
{
  "analyzer": "turkish",
  "text": "Köpekler parkta koşuyor"
}

自定义配置 #

可通过以下参数自定义该分析器:

参数说明
stopwords自定义停用词列表,默认 _turkish_
stem_exclusion不进行词干提取的词语列表

相关指南 #