Turkish 分析器 #
turkish 分析器是为土耳其语文本特别设计的语言分析器,使用土耳其语专用的小写转换。
分析器组成 #
该分析器由以下分词器和分词过滤器组成:
standard分词器:标准的文本分割apostrophe分词过滤器:移除撇号及其后字符turkish_lowercase分词过滤器:土耳其语专用小写转换(正确处理 İ/I)stop分词过滤器:过滤土耳其语停用词snowball(Turkish) 分词过滤器:土耳其语词干提取
示例 #
POST _analyze
{
"analyzer": "turkish",
"text": "Köpekler parkta koşuyor"
}
自定义配置 #
可通过以下参数自定义该分析器:
| 参数 | 说明 |
|---|---|
stopwords | 自定义停用词列表,默认 _turkish_ |
stem_exclusion | 不进行词干提取的词语列表 |