你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

关于分词干预问题

Elasticsearch | 作者 liubin | 发布于2018年12月06日 | 阅读数：2476

由于ik分词词库有省市区的次元，现在需求是比如文本是四川省成都市钉钉火锅店，用的ik_smart, 四川省，和成都市分成了完整词，在不考虑ik_max_word ,情况下，能否干预ik_smart. 拆除省市区县的。分词四川 + 省，成都+市，

1 个回复

rochy - rochy_he

修改 ik 的词典即可，不过工作量挺大的；
推荐自己根据 ik_smart 的结果做一层处理即可

可以使用 Pattern Capture Token Filter 对结果进行处理
https://www.elastic.co/guide/e ... .html

要回复问题请先登录或注册