terms keyword 精确in查询很慢

Elasticsearch | 作者 acaidemao | 发布于2020年07月24日 | 阅读数：5484

类似于mysql select * from table where field in ('', '') 只是这个In的有点多，查询前10条数据，就非常慢，field字段类型是keyword.
对mysql 的理解，如果我查到了数据应该就立即返回的；elasticsearch 貌似不是这样处理的，查看了下profile 对于in 查询，每个In的结果都进行了一次termQury，不晓得是不是这个导致了查询速度慢

5 个回复

Ombres

赞同来自: kr9226

es是倒排索引，每个term对应有一个posting list，存储符合的文章的id，最终结果要将posting list进行合并，合并速度取决于term数及posting list的长度等因素

lucene系基本都存在这个问题，关键词非常多的情况下，查询性能可能会急剧下降，因此在lucene中默认限制子句的长度为1024

acaidemao - 阿菜的猫

其中regionid 数量有一百多个

FFFrp

terms试试？

byx313 - BLOG:https://www.jianshu.com/u/43fd06f9589c

查询的时候加上"collect_mode" : "breadth_first" 试试

JiangJibo - 喊我雷锋

我觉得可以这么理解，msql的的字段加了索引，默认是btree结构，是有顺序的，所以如果加一个limit 1，那么将in 里面的参数排序后匹配到第一条就能马上返回，所以很快；

但是es的倒排索引默认是hash结构，也就是根据term的hash值来定位索引，所以默认是没有顺序的，所以理论上是需要命中所有的doc然后做一个筛选，最后排序，排序根据tf-idf原则需要找出那个term的权重最高，也就是出现term频率最低的那个term，如果命中数实在太多那么聚合筛选排序的耗费就越高。但具体要怎么聚合筛选，没看源码，等看了明白了在说说。

这是我对mysql 和 es 的in的机制的理解，说的不对见谅

要回复问题请先登录或注册

terms keyword 精确in查询很慢

5 个回复

发起人

活动推荐

相关问题

问题状态

terms keyword 精确in查询很慢

与内容相关的链接

5 个回复

发起人

活动推荐

相关问题

问题状态