es的group by在多shard下是不精确的?

作者 ZhangDaochuan | 发布于2018年07月13日 | 阅读数:196


https://blog.csdn.net/njpjsoft ... 15485  ,这个讲Lucene的文章,说在分片聚合的时候,会有不准确的情况,如果没有shard,就是对的是吧,一个index不大的时候,就不进行shard,聚合就是对的,但是很多情况一个index是很大,需要shard分片的,那就是聚合都不准了?
如果要做准确度高,比如报表类,就不适合了,如果是数据分析类,就还好,不要求那么精确,如果要精确,就不能分片,不分片,单index支持的数据量不大,感觉不如MYSQL进行group by了,不知道大家有没有遇到这个问题,有没有规避的方式
已邀请:

wocan23

赞同来自:

不精确,我也遇到这个问题

luohuanfeng

赞同来自:

有一个参数 ,shard_size ,可以调整这个参数来降低doc_count_error_upper_bound的值,当 这个值为0的时候,你查询的数据就是准的了.

这样做更耗费资源.

zhangg7723

赞同来自:

shard_size设置为0

要回复问题请先登录注册