我用k8s部署了es,今天发现不同集群都有节点在规律得掉线。
都是每20分钟掉线一次,然后瞬间又加进集群,其中没任何报错。
各个节点都没做gc,没有大任务,没触发gc掉线。
k8s集群已运行半年,使用的flannel组建的内网。
es5.2.2
docker 17.04.0-ce
使用的https://github.com/fabric8io/e ... netes插件去发现集群
日志已截图。
不同集群掉线节点都是每20分钟一次,请问es或者某个组件有每20分钟触发一次的任务么。
EDIT:
监控了一次,master left 的时候,其实能ping通。如图。
都是每20分钟掉线一次,然后瞬间又加进集群,其中没任何报错。
各个节点都没做gc,没有大任务,没触发gc掉线。
k8s集群已运行半年,使用的flannel组建的内网。
es5.2.2
docker 17.04.0-ce
使用的https://github.com/fabric8io/e ... netes插件去发现集群
日志已截图。
不同集群掉线节点都是每20分钟一次,请问es或者某个组件有每20分钟触发一次的任务么。
EDIT:
监控了一次,master left 的时候,其实能ping通。如图。
3 个回复
famoss
赞同来自: rockybean 、ybtsdst
排查步骤:
翻看es源码,尝试查找原因。
没能看出什么猫腻,不过,发现了这段,记录了一段trace日志 所以调用es的接口更改日志级别,改为trace
正好20分钟后打印出了日志
找到一个类似的issue,然后猜测到时防火墙问题,最后搞定。
rockybean - Elastic Certified Engineer, ElasticStack Fans,公众号:ElasticTalk
赞同来自:
zqc0512 - andy zhou
赞同来自: