简繁转换过滤器(STConvert Filter)

简繁转换过滤器 #

stconvert 词元过滤器在简体中文和繁体中文之间进行转换,来自 analysis-stconvert 插件。

前提条件 #

需要安装 analysis-stconvert 插件:

bin/easysearch-plugin install analysis-stconvert

功能说明 #

此过滤器支持:

  • 简体 → 繁体(s2t
  • 繁体 → 简体(t2s

可用于实现跨简繁的统一搜索。

使用示例 #

PUT my-stconvert-index
{
  "settings": {
    "analysis": {
      "filter": {
        "to_simplified": {
          "type": "stconvert",
          "convert_type": "t2s"
        }
      },
      "analyzer": {
        "unified_chinese": {
          "type": "custom",
          "tokenizer": "ik_smart",
          "filter": ["to_simplified"]
        }
      }
    }
  }
}

测试效果 #

GET /_analyze
{
  "tokenizer": "ik_smart",
  "filter": [{"type": "stconvert", "convert_type": "t2s"}],
  "text": "計算機程式設計"
}

响应:计算机 程式 设计

参数 #

参数默认值说明
convert_types2t转换方向:s2t(简→繁)或 t2s(繁→简)
delimiter,多音字拼音分隔符
keep_bothfalse是否同时保留简体和繁体

相关链接 #