罗马尼亚语词干过滤器(Romanian Stemmer)

罗马尼亚语词干过滤器 #

romanian_stemmer 词元过滤器使用 Snowball 算法对罗马尼亚语文本进行词干提取。

功能说明 #

此过滤器移除罗马尼亚语名词的格变化和定冠词后缀,以及动词变位后缀。

使用示例 #

PUT my-romanian-index
{
  "settings": {
    "analysis": {
      "filter": {
        "ro_stem": {
          "type": "stemmer",
          "language": "romanian"
        }
      },
      "analyzer": {
        "my_romanian": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": ["lowercase", "ro_stem"]
        }
      }
    }
  }
}

测试效果 #

GET /_analyze
{
  "analyzer": "romanian",
  "text": "programarea programatori"
}

参数 #

参数说明
typestemmer过滤器类型
languageromanian指定罗马尼亚语 Snowball 词干算法

在语言分析器中的位置 #

罗马尼亚语分析器 内置了此过滤器。