德语词干过滤器(German Stemmer)

德语词干过滤器 #

german_light_stem 词元过滤器使用轻量级算法对德语文本进行词干提取。

功能说明 #

Easysearch 提供多种德语词干算法:

算法language说明
轻量级light_german默认,最保守
最小化minimal_german只处理复数
Snowballgerman标准 Snowball 算法
Snowball2german2改进的 Snowball

使用示例 #

PUT my-german-index
{
  "settings": {
    "analysis": {
      "filter": {
        "de_stem": {
          "type": "stemmer",
          "language": "light_german"
        }
      },
      "analyzer": {
        "my_german": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": ["lowercase", "german_normalization", "de_stem"]
        }
      }
    }
  }
}

测试效果 #

GET /_analyze
{
  "analyzer": "german",
  "text": "Programmierung Programmierer Programme"
}

参数 #

参数说明
typestemmer过滤器类型
languagelight_german / minimal_german / german / german2选择词干算法

在语言分析器中的位置 #

德语分析器 内置了 light_german 词干提取器。