es6

es6

6.x 复制片恢复引起flush操作死循环的BUG

Elasticsearchkennywu76 发表了文章 • 14 个评论 • 730 次浏览 • 2018-04-13 11:52 • 来自相关话题

⚠️ 截止目前最新的ES6版本6.2.3,存在一个复制片恢复过程中可能引起flush死循环的BUG。 我们近期一个ES6.2.2的集群触发了这个bug,导致了一些麻烦。对于写入量很高的集群,这个BUG可能会导致系统的文件描述符被耗尽,结点挂掉,并且重启后依然挂掉的情况。     这个问题发生的时候,必须找到数据目录下,存在大量translog文件的索引目录(可能会有上万的translog文件),找到对应目录的索引名称,然后关闭复制片,待translog清理完毕以后,再打开复制片重新复制。    该问题有人已经在GITHUB上汇报如下: issues/29097​   BUG已经被确认,修复代码已经进入6.2.4 pull/29125 ,但该版本还未正式release。   准备上6版本的同学先请稍待新版本发布以后再行动,已经在6版本的同学,注意监控结点的FD数量,持续升高的情况需要进行关注。
fds.jpg
   

6.x 复制片恢复引起flush操作死循环的BUG

Elasticsearchkennywu76 发表了文章 • 14 个评论 • 730 次浏览 • 2018-04-13 11:52 • 来自相关话题

⚠️ 截止目前最新的ES6版本6.2.3,存在一个复制片恢复过程中可能引起flush死循环的BUG。 我们近期一个ES6.2.2的集群触发了这个bug,导致了一些麻烦。对于写入量很高的集群,这个BUG可能会导致系统的文件描述符被耗尽,结点挂掉,并且重启后依然挂掉的情况。     这个问题发生的时候,必须找到数据目录下,存在大量translog文件的索引目录(可能会有上万的translog文件),找到对应目录的索引名称,然后关闭复制片,待translog清理完毕以后,再打开复制片重新复制。    该问题有人已经在GITHUB上汇报如下: issues/29097​   BUG已经被确认,修复代码已经进入6.2.4 pull/29125 ,但该版本还未正式release。   准备上6版本的同学先请稍待新版本发布以后再行动,已经在6版本的同学,注意监控结点的FD数量,持续升高的情况需要进行关注。
fds.jpg