德语词干过滤器 #
german_light_stem 词元过滤器使用轻量级算法对德语文本进行词干提取。
功能说明 #
Easysearch 提供多种德语词干算法:
| 算法 | language 值 | 说明 |
|---|---|---|
| 轻量级 | light_german | 默认,最保守 |
| 最小化 | minimal_german | 只处理复数 |
| Snowball | german | 标准 Snowball 算法 |
| Snowball2 | german2 | 改进的 Snowball |
使用示例 #
PUT my-german-index
{
"settings": {
"analysis": {
"filter": {
"de_stem": {
"type": "stemmer",
"language": "light_german"
}
},
"analyzer": {
"my_german": {
"type": "custom",
"tokenizer": "standard",
"filter": ["lowercase", "german_normalization", "de_stem"]
}
}
}
}
}
测试效果 #
GET /_analyze
{
"analyzer": "german",
"text": "Programmierung Programmierer Programme"
}
参数 #
| 参数 | 值 | 说明 |
|---|---|---|
type | stemmer | 过滤器类型 |
language | light_german / minimal_german / german / german2 | 选择词干算法 |
在语言分析器中的位置 #
德语分析器 内置了 light_german 词干提取器。