使用 shuf 来打乱一个文件中的行或是选择文件中一个随机的行。

如何用ElasticSearch对groupby后的结果进行distinct后的sort操作,相等于求topN?

Elasticsearch | 作者 enjoyhot | 发布于2017年04月01日 | 阅读数:6933

如图,其实是为了这个操作,需要做排序:
select imei,count(distinct app) as num from table where drt between time1 and time2 group by imei order by num desc limit N;


参考:https://www.elastic.co/guide/e ... order
 
QQ截图20170401224213.png


发现内存飙高,超出分配的10G内存,Elastic集群直接挂了,相似问题有:
http://elasticsearch.cn/question/743
但该问题不是topN操作。
 
我也用Java api尝试做了一下,结果一样崩了。
 
初学者一枚,不知各位gg有没有相关的经验借鉴。
 
在调研之后,深度翻页,折叠操作似乎能替代以上的实现(都是query match all),不过并没有类似的例子以供参考。
已邀请:

要回复问题请先登录注册