Hello,World

ES集群 GC 问题

Elasticsearch | 作者 wl30564 | 发布于2018年03月22日 | 阅读数:2909

手里维护的ES集群有点时间了,开始的时候一切OK 最近 同事反应 经常出现  "Request Timeout after 30000ms"   这个时候 ES 集群就会有条日志 
[INFO ][o.e.m.j.JvmGcMonitorService] [esnode-1] [gc][607456] overhead, spent [425ms] collecting in the last [1s]
这台问题 该日志解决???
 
 
后来又找了监控软件:ElasticHQ   不知道会不会和 GC Old Generation Duration 这个也有关系 。

old-gc.jpg

 
已邀请:

kennywu76 - Wood

赞同来自: wl30564

监控数据看heap并不存在吃紧的情况,日志里的GC warnning在执行比较消耗内存的查询聚合时出现也是正常的。 请求超时需要具体分析请求的数据量和查询DSL。
 
当查询的索引数据量很大,查询的时间跨度也很大的时候,某些高消耗的查询聚合可能无法在30s以内返回。这时候,应该将图表对应的查询DSL找出来,在dev console上开查询里的"profile": true这个选项,分析一下耗时用在哪些地方。
 
通常kibana上最容易出现高耗时的情况是对某些高基数的字段做terms aggregation,如client ip,  user id这类可能包含上百万,千万不同值的字段, 如果还有做嵌套聚合就可能更慢。  

ryan_online

赞同来自:

出现这个问题的时候,是大量写入吗??

leoniu

赞同来自:

什么版本的elasticsearch?cluster stats Api的完整返回结果是什么?

要回复问题请先登录注册