ICU 分析器 #
icu 分析器是为多语言文本分析的分析器,基于 ICU(International Components for Unicode)实现,对亚洲语言混合文本提供比标准分析器更好的分词效果。
需要安装 analysis-icu 插件。分析器组成 #
该分析器由以下分词器和分词过滤器组成:
icu_tokenizer分词器:使用 ICU Unicode 文本分割算法icu_normalizer分词过滤器:Unicode 归一化(NFC 模式)
示例 #
POST _analyze
{
"analyzer": "icu",
"text": "Elasticsearch の全文検索エンジン"
}