疲劳是最舒适的枕头,努力工作吧。

服务器重启后es进程假死

Elasticsearch | 作者 qq1990609320 | 发布于2017年07月18日 | 阅读数:13343

es 版本: 5.3.2
操作系统:centos 6.7
集群已经正常运行了几个星期了,刚才突然有个节点掉出集群.
我重启这台服务器后再执行启动es服务命令 service elasticsearch start
启动成功后,之前配置的日志文件路径中没有日志输出(以前正常时是有日志输出的)。
执行service elasticsearch status命令显示elasticsearch 已死,但PID文件仍存
es.jpg

2017-07-19最新情况:
这是一个单纯的data node节点,不是主节点也不是备选主节点。
进程是2017-07-18 18:30分左右启动的,启动后一直处于假死状态,没找到任何日志输出
ps -ef|grep java也显示有es进程.
根据master节点日志显示,直到2017-07-18 23:29分才发现该节点.
[2017-07-18T23:29:11,074][INFO ][o.e.c.s.ClusterService   ] [node-2] added {{node-5}{VmMcN6lYSje1So6EXk7usw}{Vdm2qHsKTkyy16wnTfSKeg}{IP}{IP:9300},}, reason: zen-disco-node-join[{node-5}{VmMcN6lYSje1So6EXk7usw}{Vdm2qHsKTkyy16wnTfSKeg}{IP}{IP:9300}]
node-2是master节点,node-5是假死的那个data node节点。
这中间假死了3个小时,这是我第二次遇到该问题,每次都是等待它自己恢复正常,一直没找到原因。
请问各位同学怎么能找到假死原因?或者看哪里的日志能获取到有效信息。
已邀请:

qq1990609320 - 一句话介绍

赞同来自: medcl

我想我找到了,应该是在elasticsearch.service中配置的标准输出位置吧,谢谢大家。

wyntergreg

赞同来自:

elasticsearch这个服务脚本显然是自己写的,查看一下status是怎么写的

qq1990609320 - 一句话介绍

赞同来自:

问题还未解决,自己顶一下。

medcl - 今晚打老虎。

赞同来自:

看看服务的启动日志,有没有什么信息提示:
sudo journalctl -f

要回复问题请先登录注册