怎么又是你

ES集群 failed to ping

Elasticsearch | 作者 sbjatqdx | 发布于2017年02月09日 | 阅读数:5766

ES版本:5.0.2   JDK:1.8   HEAP:30g
节点: 两个数据节点,1个主节点
现在的情况是数据节点探测主节点时出现failed to ping,每次会有一个数据节点从集群中脱离,然后恢复正常,数据量目前总共才350G,索引:130个,按日建立索引。
监控服务器CPU使用率等比较正常,但是看jvm频繁发生gc
 39.16   0.00  83.36  54.05  93.78  85.29  10864  321.479     4    0.437  321.916
  0.00  42.14  51.27  54.05  93.78  85.29  10865  321.508     4    0.437  321.945
 47.26   0.00   1.14  54.06  93.78  85.29  10866  321.536     4    0.437  321.973
 47.26   0.00  90.52  54.06  93.78  85.29  10866  321.536     4    0.437  321.973
 50.43   0.00  11.97  54.08  93.78  85.29  10868  321.591     4    0.437  322.028
 50.43   0.00  74.84  54.08  93.78  85.29  10868  321.591     4    0.437  322.028
  0.00  49.79  63.93  54.09  93.78  85.29  10869  321.619     4    0.437  322.056
 43.68   0.00  14.73  54.10  93.78  85.29  10870  321.645     4    0.437  322.082
 43.68   0.00  99.70  54.10  93.78  85.29  10871  321.645     4    0.437  322.082
  0.00  28.15  64.35  54.10  93.78  85.29  10871  321.671     4    0.437  322.108
 36.91   0.00  10.33  54.11  93.78  85.29  10872  321.700     4    0.437  322.137
  0.00  27.68   7.45  54.13  93.78  85.29  10873  321.727     4    0.437  322.164
  0.00  27.68  49.54  54.13  93.78  85.29  10873  321.727     4    0.437  322.164
  0.00  25.21  99.03  54.53  93.78  85.29  10876  321.845     4    0.437  322.282
 20.50   0.00  47.84  54.53  93.78  85.29  10876  321.865     4    0.437  322.302
  0.00  24.12  11.41  54.53  93.78  85.29  10877  321.888     4    0.437  322.325
======================
不知道这种情况应该如何优化。。。。
已邀请:

sbjatqdx

赞同来自:

参考链接:https://discuss.elastic.co/t/n ... 62/17
调整如下参数:
net.ipv4.tcp_keepalive_time = 600
net.ipv4.tcp_keepalive_intvl = 60
net.ipv4.tcp_keepalive_probes = 20

不过没用,还是脱离集群,后来调整了JVM的 -Xmn参数,增加到了8G (heap 30G),目前来看暂时正常
thread_pool.bulk.queue_size: 5000

 

要回复问题请先登录注册