身安不如心安,屋宽不如心宽 。

elasticsearch搜索简繁体中文的问题

Elasticsearch | 作者 tuankun | 发布于2018年05月25日 | 阅读数:7071

各位好,
    我当前有把公司的exchcnage messagetracking log导入到ELK中,其中邮件主旨中有些是简体中文,有些是繁体中文,比如"中国”或者“中國”,这些简繁体中文原封不动地都已经存入到ELK中了,但现在我想要的結果是,如果我搜索關鍵字“中国”或者“中國”时,无法同时搜索出简繁体的内容出来,只能搜索简体字,出现简体的结果,搜索繁体字,出现繁体的结果(由于我当前使用的是IK中文分词,繁体支持不理想,会把繁体中文切成单个字)。
 
我看到medcl大神有推荐个简繁体转换的plugin:elasticsearch-analysis-stconvert,  查看说明,好像只对自己输入的关键字进行转换,我现在的需求是,无论我输入“中国”或者“中國”关键字搜索时,需要把简繁体的结果都显示出来,大家有什么办法吗,感谢。
已邀请:

medcl - 今晚打老虎。

赞同来自: cccthought

你应该在 mapping 里面使用 stconvert,确保索引的时候就已经转成了简体,查询的时候,也同样使用这个 analyzer 进行统一成简体,不就成了。只是查询的时候用,索引里面还是繁体当然会匹配不上的。

要回复问题请先登录注册