罗马尼亚语词干过滤器 #
romanian_stemmer 词元过滤器使用 Snowball 算法对罗马尼亚语文本进行词干提取。
功能说明 #
此过滤器移除罗马尼亚语名词的格变化和定冠词后缀,以及动词变位后缀。
使用示例 #
PUT my-romanian-index
{
"settings": {
"analysis": {
"filter": {
"ro_stem": {
"type": "stemmer",
"language": "romanian"
}
},
"analyzer": {
"my_romanian": {
"type": "custom",
"tokenizer": "standard",
"filter": ["lowercase", "ro_stem"]
}
}
}
}
}
测试效果 #
GET /_analyze
{
"analyzer": "romanian",
"text": "programarea programatori"
}
参数 #
| 参数 | 值 | 说明 |
|---|---|---|
type | stemmer | 过滤器类型 |
language | romanian | 指定罗马尼亚语 Snowball 词干算法 |
在语言分析器中的位置 #
罗马尼亚语分析器 内置了此过滤器。