橡皮、老虎皮、狮子皮哪一个最不好?

es普通的data节点down掉,集群有1分多钟的时间不可用

Elasticsearch | 作者 beiertiao | 发布于2020年04月15日 | 阅读数:1670

我是一个3master,2data的集群,在进行高可用的测试时,其中一个data节点down掉后,集群变得不可用,要等三个超时时间,大概90多秒的时间,集群才能恢复正常,请问这个问题是什么原因,大家是如何解决的?
已邀请:

xiao

赞同来自: byx313

你这种现象应该不是彻底进程挂掉,而是类似断网连接不上但是ES又没有认为该节点进程彻底死掉,所以会等三个超时时间不断去确认data节点是否存活。前端时间针对这种现象我有测试过,如果这个data节点上没有主分片的话还好,不会对写入有什么影响。

byx313 - BLOG:https://www.jianshu.com/u/43fd06f9589c

赞同来自:

上一下master的log?

taoyantu - it

赞同来自:

我们也碰到过问题。应该是有一段节点的假死现象。目前感觉无解,希望大神解答

要回复问题请先登录注册