使用 shuf 来打乱一个文件中的行或是选择文件中一个随机的行。

ES集群大量写入导致cpu和memory增高,如何排查数据源是哪边?从哪边写入的数据

Elasticsearch | 作者 hide | 发布于2023年06月09日 | 阅读数:2792

项目中使用fluent-bit和ES来做log的收集,最近发现每天早上的时候ES集群的节点会的cpu和memory会飙升,报警。
查看GET _nodes/hot_threads 和 GET /_cat/tasks 发现cpu被大量的write给占用了。
平时集群的cpu只会到25%左右,报警的时候会彪到70%-90%,现在想升级集群,增加节点不太可能,没这个预算。所以想先找到是哪边在大量写入。请问一下,该如何找到是哪台机器上的fluent-bit在大量写入啊?
 
ES版本:6.6.2
集群信息:
      3个节点
      每个节点 内存64G 分配给es31G 磁盘2T 16核非高速cpu
 
 
 
已邀请:

luohuanfeng

赞同来自:

监控es主机流量 或者是 fluent-bit节点的流量?

JackMusk - Jack Mush Pony awesome

赞同来自:

可以选择抓包,看相关语句的来源IP和端口,然后到相关ip 看该端口的进程。简单点可以iotop来看看来源哪个IP流量多,不过这个不太准确。

要回复问题请先登录注册