用了Elasticsearch,一口气上5T

es 集群某个节点突然脱网,导致整个集群僵死,写入和查询都无法响应

Elasticsearch | 作者 xiao | 发布于2019年04月23日 | 阅读数:3518

模拟测试将集群中的某个节点断网,集群无法响应,查询和写入都失败。集群在discovery.zen.fd.ping_timeout*discovery.zen.fd.ping_retries*discovery.zen.fd.ping_interval 时间后,才会恢复。如果是master节点断网,影响时长更长。请问大家有遇到过这个问题吗 意味着集群的任意一个服务器不能出现断网的情况吗
已邀请:

nodexy - Another developer !

赞同来自:

建议交代下集群的拓扑结构,不然很难判断。
 
最佳实践,3个候选master!

xiao

赞同来自:

集群设计是3个节点,master和data在同一个实例上,针对集群中的数据节点断开网络的时候,真正的master节点所在的服务器进程和master都是存活的,但是curl IP:端口/_cat/nodes 集群是没有任何反应的,直到一定时间后断网的那个节点脱离集群后,API的接口返回了集群的节点信息

要回复问题请先登录注册