悟空,拿我的打狗棒来

ES分词可以用正则表达式吗

Elasticsearch | 作者 z_hong7 | 发布于2017年03月30日 | 阅读数:5785

用es+ik分词,能不能在ik的词表里面加入正则
已邀请:

kennywu76 - Wood

赞同来自:

tokenizer配置列表里加一个pattern-tokenizer应该就可以了,支持正则。
https://www.elastic.co/guide/e ... .html

kennywu76 - Wood

赞同来自:

我搞错了。 tokenizer只能配置一个,如果已经用了ik,就只能用ik的tokenizer,没有办法再加一个pattern tokennizer。 除非是更改ik的tokenizer植入这个功能,或者数据索引前在索引段用正则预处理成token列表,然后将列表写入对应的字段,通过ik进一步分词。
 
 

要回复问题请先登录注册