法语词干过滤器(French Stemmer)

法语词干过滤器 #

french_light_stem 词元过滤器使用 Lucene 的轻量级法语词干算法,移除法语常见的形态后缀。

功能说明 #

法语分析器默认使用轻量级词干提取light_french),而非 Snowball 算法。轻量级算法更保守:

算法说明适用场景
light_french轻量级,只移除明显后缀默认推荐
frenchSnowball 完整词干更激进的归约
minimal_french最小化词干最保守

使用示例 #

PUT my-french-index
{
  "settings": {
    "analysis": {
      "filter": {
        "fr_stem": {
          "type": "stemmer",
          "language": "light_french"
        }
      },
      "analyzer": {
        "my_french": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": ["lowercase", "elision", "fr_stem"]
        }
      }
    }
  }
}

测试效果 #

GET /_analyze
{
  "analyzer": "french",
  "text": "programmation programmeurs programmes"
}

参数 #

参数说明
typestemmer过滤器类型
languagelight_french / french / minimal_french选择词干算法

在语言分析器中的位置 #

法语分析器 内置了 light_french 词干提取器。