1.6.0中partten_replace类型TokenFilter的+,*都是懒惰匹配?

Elasticsearch | 作者 abird | 发布于2016年01月29日 | 阅读数:3235

  在1.6.0中使用partten_replace token过滤器对token处理时,发现其支持的正则规则跟常规的正则规则有所不同。在常规正则中,*和+都是贪婪匹配,匹配尽可能多的结果。而es中+和*匹配效果都是懒惰的。一个例子:“ir_urlname:zjol.com.cnnotir_sitename:浙江在线”  要匹配出其中所有中文,使用[u4e00-u9fa5]+只能匹配到“浙”一个字,使用[u4e00-u9fa5]*什么都匹配不到。请问谁知道怎样能让+和*变为贪婪性匹配?
已邀请:

要回复问题请先登录注册