关于分词干预问题

Elasticsearch | 作者 liubin | 发布于4 天前 | 阅读数:92

由于ik分词词库有省市区的次元,现在需求是比如文本是四川省成都市钉钉火锅店,用的ik_smart,  四川省,和成都市 分成了完整词,在不考虑ik_max_word ,情况下,能否干预ik_smart. 拆除省市区县的。分词四川 + 省, 成都+市,
已邀请:

rochy - rochy_he@jointsky

赞同来自:

修改 ik 的词典即可,不过工作量挺大的;
推荐自己根据 ik_smart 的结果做一层处理即可
 
可以使用 Pattern Capture Token Filter 对结果进行处理
https://www.elastic.co/guide/e ... .html

要回复问题请先登录注册