6.3.2ES短时间内创建大量索引后句柄耗尽,重启集群也不释放

Elasticsearch | 作者 Boc_lyz | 发布于2019年07月22日 | 阅读数:462

ES版本6.3.2
我们的程序按照时间存不同索引,测试同事造了些奇怪的数据,结果一批数过来,20秒内连续创建了80个索引,然后文件柄耗尽。重启集群后,句柄没有释放,用lsof grep delete发现被controller_log和controller_command占用:

7E6029C6-A4F5-46D1-81F1-55565529AEB0.png

上面的进程就是ES,最大文件数设成65w了
 
这些controller是什么呢?
 
这种情况怎么解决?
 
7.22下午:在对所有索引执行完truncate translog后,句柄无明显变化
已邀请:

zqc0512 - andy zhou

赞同来自:

这数据正常么?删除索引撒。

medcl - 今晚打老虎。

赞同来自:

是不是别的程序在用,而不是 es 呢? 另外,句柄占用了多少啊?最大文件数调过了吧?

Judge

赞同来自:

堆外内存中的segment也会占用句柄吧,曾经碰到过refresh周期太短,堆外内存有大量小段,另外可以cat thread pool 看下是不是有哪种thread poo用比较多的,既然占用大量句柄,肯定内部在做什么操作,从线程池中也能间接反映出来

Boc_lyz - 走在NoSql的路上

赞同来自:

看来这个问题没办法解决喽
 

要回复问题请先登录注册