即使是不成熟的尝试,也胜于胎死腹中的策略。

求助:es的ansj自定义分词的问题

Elasticsearch | 作者 liangjunpeng | 发布于2016年11月10日 | 阅读数:3079

一段带连续数字或者字母的文字,es用ansj分词,要求中文用index_ansj,而数字字母等用nGram,配置文件怎么写。。。。我写的使用nGram filter,但是结果是index_ansj分过的中文再次被nGram给分词了,有没有知道怎么解决的
已邀请:

ansj - hi i am i

赞同来自:

这个玩意是不是需要做一个  tokenizer 根据词性判断。。。或者我们在index分词中支持这种情况。。。
 

rochy - rochy_he

赞同来自:

使用 multi_field 的方式,设置附加字段即可

要回复问题请先登录注册