亲,只收二进制

中文特殊字符搜索不到

Elasticsearch | 作者 daier9498060 | 发布于2019年11月29日 | 阅读数:1073

【      请问elasticsearch对于这种特殊的符合怎么搜索啊?字段是text
 
GET neirong/_search
{
  "size": 10, 
  "query": {
    "bool": {
      "must": [
        { "match_phrase": { "content": "【美团】" } }
      ]
}
}
}
 
我只想要这种的内容【美团】,但是结果会出现【美团网】这种。
已邀请:

core_wzw - 某AILab搜索技术负责人

赞同来自:

理论上“【美团】”被分成“【”、“美团”、“】”,而match_phrase默认slop是0,也就是必须全命中“【”+“美团”+“】”才会被召回。可以反推出“【”、“】”没有被分词后作为倒排token,可能是去停用词阶段没了,在ik分词器默认词典里添加这两个字符就行。

要回复问题请先登录注册