Hello,World

对于ik拼音分词性能影响非常大

Elasticsearch | 作者 liubin | 发布于2018年12月25日 | 阅读数:3944

ik的拼音分词,在做检索的时候耗时是别的几十倍,直接吃满cpu,有没有好的替代方案么
已邀请:

Yu Tao

赞同来自: medcl

确实 我也遇到过这种问题,所以在全文搜索中我不用拼音分词。
另外,你要确认你的分词的使用场景是什么,你看现在大部分的拼音分词是在搜索栏当中用到的,如果是全文搜索还是尽量别用了 

rochy - rochy_he

赞同来自: liubin

ik的拼音分词可以设置很多不需要的选项关闭,这样可以大大减少对 CPU 的占用
例如:
limit_first_letter_length 默认为 16,首字母组合 7、8 位就已经足够了
none_chinese_pinyin_tokenize 默认为 true,推荐设置为 false,关闭对组合拼音的识别,因为大多数场景根本用不到
还有全拼单字(keep_full_pinyin)等选项,请根据实际需要进行优化

doctor

赞同来自:

ngram?

要回复问题请先登录注册