ES集群 failed to ping

Elasticsearch | 作者 sbjatqdx | 发布于2017年02月09日 | 阅读数：7018

ES版本：5.0.2   JDK:1.8   HEAP:30g
节点：两个数据节点，1个主节点
现在的情况是数据节点探测主节点时出现failed to ping，每次会有一个数据节点从集群中脱离，然后恢复正常，数据量目前总共才350G，索引：130个，按日建立索引。
监控服务器CPU使用率等比较正常，但是看jvm频繁发生gc
39.16   0.00 83.36 54.05 93.78 85.29 10864 321.479     4    0.437 321.916
0.00 42.14 51.27 54.05 93.78 85.29 10865 321.508     4    0.437 321.945
47.26   0.00   1.14 54.06 93.78 85.29 10866 321.536     4    0.437 321.973
47.26   0.00 90.52 54.06 93.78 85.29 10866 321.536     4    0.437 321.973
50.43   0.00 11.97 54.08 93.78 85.29 10868 321.591     4    0.437 322.028
50.43   0.00 74.84 54.08 93.78 85.29 10868 321.591     4    0.437 322.028
0.00 49.79 63.93 54.09 93.78 85.29 10869 321.619     4    0.437 322.056
43.68   0.00 14.73 54.10 93.78 85.29 10870 321.645     4    0.437 322.082
43.68   0.00 99.70 54.10 93.78 85.29 10871 321.645     4    0.437 322.082
0.00 28.15 64.35 54.10 93.78 85.29 10871 321.671     4    0.437 322.108
36.91   0.00 10.33 54.11 93.78 85.29 10872 321.700     4    0.437 322.137
0.00 27.68   7.45 54.13 93.78 85.29 10873 321.727     4    0.437 322.164
0.00 27.68 49.54 54.13 93.78 85.29 10873 321.727     4    0.437 322.164
0.00 25.21 99.03 54.53 93.78 85.29 10876 321.845     4    0.437 322.282
20.50   0.00 47.84 54.53 93.78 85.29 10876 321.865     4    0.437 322.302
0.00 24.12 11.41 54.53 93.78 85.29 10877 321.888     4    0.437 322.325
======================
不知道这种情况应该如何优化。。。。

1 个回复

sbjatqdx

参考链接：https://discuss.elastic.co/t/n ... 62/17
调整如下参数：
net.ipv4.tcp_keepalive_time = 600
net.ipv4.tcp_keepalive_intvl = 60
net.ipv4.tcp_keepalive_probes = 20

不过没用，还是脱离集群，后来调整了JVM的 -Xmn参数，增加到了8G (heap 30G)，目前来看暂时正常
thread_pool.bulk.queue_size: 5000

要回复问题请先登录或注册

ES集群 failed to ping

1 个回复

发起人

活动推荐

相关问题

问题状态

ES集群 failed to ping

与内容相关的链接

1 个回复

发起人

活动推荐

相关问题

问题状态