要不要也来分享分享一下啊

ik_smart词库更新后,分词时好时坏

Elasticsearch | 作者 liuchao | 发布于2020年01月18日 | 阅读数:2309

ik_smart词库添加 抖音,然后使用分词,有时候分词正确,就是抖音一个词,有时候 分词成 抖 ,音 两个字,时好时坏
 
es版本:6.3.2
 
总共7台机器,一台主节点 6台数据节点
9F652F30-BFBC-4e53-8E89-41498FBC1B23.png 356209FD-8A44-43c6-9ACF-64F58FA2A360.png
已邀请:

Ombres

赞同来自:

看样子是多个节点的词典不一致导致的,检查一下是否所有的节点的词典都成功添加了

hapjin

赞同来自:

这也有可能是分词问题,多个句子包含了 '抖音' 这2个字符, '抖音' 这2个字符的 上下文 不一样,这2个字符 不一定 能分在一起吧

要回复问题请先登录注册