es 版本: 5.3.2
操作系统:centos 6.7
集群已经正常运行了几个星期了,刚才突然有个节点掉出集群.
我重启这台服务器后再执行启动es服务命令 service elasticsearch start
启动成功后,之前配置的日志文件路径中没有日志输出(以前正常时是有日志输出的)。
执行service elasticsearch status命令显示elasticsearch 已死,但PID文件仍存
2017-07-19最新情况:
这是一个单纯的data node节点,不是主节点也不是备选主节点。
进程是2017-07-18 18:30分左右启动的,启动后一直处于假死状态,没找到任何日志输出
ps -ef|grep java也显示有es进程.
根据master节点日志显示,直到2017-07-18 23:29分才发现该节点.
[2017-07-18T23:29:11,074][INFO ][o.e.c.s.ClusterService ] [node-2] added {{node-5}{VmMcN6lYSje1So6EXk7usw}{Vdm2qHsKTkyy16wnTfSKeg}{IP}{IP:9300},}, reason: zen-disco-node-join[{node-5}{VmMcN6lYSje1So6EXk7usw}{Vdm2qHsKTkyy16wnTfSKeg}{IP}{IP:9300}]
node-2是master节点,node-5是假死的那个data node节点。
这中间假死了3个小时,这是我第二次遇到该问题,每次都是等待它自己恢复正常,一直没找到原因。
请问各位同学怎么能找到假死原因?或者看哪里的日志能获取到有效信息。
操作系统:centos 6.7
集群已经正常运行了几个星期了,刚才突然有个节点掉出集群.
我重启这台服务器后再执行启动es服务命令 service elasticsearch start
启动成功后,之前配置的日志文件路径中没有日志输出(以前正常时是有日志输出的)。
执行service elasticsearch status命令显示elasticsearch 已死,但PID文件仍存
2017-07-19最新情况:
这是一个单纯的data node节点,不是主节点也不是备选主节点。
进程是2017-07-18 18:30分左右启动的,启动后一直处于假死状态,没找到任何日志输出
ps -ef|grep java也显示有es进程.
根据master节点日志显示,直到2017-07-18 23:29分才发现该节点.
[2017-07-18T23:29:11,074][INFO ][o.e.c.s.ClusterService ] [node-2] added {{node-5}{VmMcN6lYSje1So6EXk7usw}{Vdm2qHsKTkyy16wnTfSKeg}{IP}{IP:9300},}, reason: zen-disco-node-join[{node-5}{VmMcN6lYSje1So6EXk7usw}{Vdm2qHsKTkyy16wnTfSKeg}{IP}{IP:9300}]
node-2是master节点,node-5是假死的那个data node节点。
这中间假死了3个小时,这是我第二次遇到该问题,每次都是等待它自己恢复正常,一直没找到原因。
请问各位同学怎么能找到假死原因?或者看哪里的日志能获取到有效信息。
4 个回复
qq1990609320 - 一句话介绍
赞同来自: medcl
wyntergreg
赞同来自:
qq1990609320 - 一句话介绍
赞同来自:
medcl - 今晚打老虎。
赞同来自: