不为失败找理由,要为成功找方法。

elasticsearch 集群中某个节点write 队列总是爆满,导致数据写入很慢

Elasticsearch | 作者 wangdw | 发布于2021年04月26日 | 阅读数:267

软件版本; elasticsearch  7.2 
运行环境: 三个master 节点,三个协调节点,41个数据节点
现在环境每天主要的数据写入,目前总是出现数据写入延迟,查看集群后发现以下问题

微信图片编辑_20210426101554.jpg

 
09-01这个节点的写线程池 总是处于爆满状态,其余节点确没有这么繁忙
 
查看了下这个节点上的分片数量和其他节点差不多,不存在分片不均衡的问题。
 

微信图片编辑_20210426102248.jpg

查看了09-01这个节点的tasks情况,有大量的写入任务
 

微信图片编辑_20210426102622.jpg

查看09-01节点对应的磁盘 /dev/sdb  io 也很低
 
烦请各位大佬给点思路,问题可能出现在什么地方
已邀请:

pony_maggie - 公众号:犀牛饲养员的技术笔记

赞同来自:

集群上是一个索引还是多个索引,从业务场景上看看是不是有业务热点写入,还有写入的routing是什么机制,结合业务看看有没有热点。

JaydenRansom - 从事数据密集系统开发

赞同来自:

refresh多的话是不是客户端一直在发起refresh请求?之前这边遇到过客户端一直在发refresh请求的场景

要回复问题请先登录注册