即使是不成熟的尝试,也胜于胎死腹中的策略。

ES对于中英文合并的词语如何解析

Elasticsearch | 作者 magic_lee | 发布于2018年01月31日 | 阅读数:3937

我ES中已加入了IK分词,但是对于一些可能存在的中文+英文的检索关键词,IK显得无能为力。
ES索引记录:
1、京12345A
2、京A12345
3、京12AA45
4、冀A12345
比如车牌号“京A12345”,会被解析成:“京”和“A12345”,当输入检索关键词“京A”时,期望的列表中“京A12345”应该拍在最前面,但是实际上排名最前的是“京B2AA5”。我试过在词库中添加“京A”,但效果更差,根本无法达到所需效果。
神支招,是否有什么好的解决办法。
已邀请:

venyowang - 90

赞同来自:

使用ngram分词器?

laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net

赞同来自:

模糊匹配wildcard谁排在前面,试一试?

jhonbo

赞同来自:

将“京A1232131”这个字段的索引设置成not_analyzed的,然后使用短语匹配match_phrase进行检索,或者使用正则

要回复问题请先登录注册