我们业务使用的ES是7.3.1的版本,其中有一个节点的ES数据盘使用率达到79%,其他两个节点在65%左右,在进行数据批量写入的时候报一个固定的索引的shard不存在。去ES节点调用索引查询接口发现,索引是存在的,集群的状态也是健康的。怀疑是触发了高水位导致的索引上锁,于是调用了接口设定该索引的index.blocks.read_only_allow_delete值为null,数据可以正常写入了。
溯源时,排查ES的3个节点磁盘使用率均未达到80%以上过(我们针对ES的磁盘使用是有告警的85%就会触发告警),并未有告警产生。而且磁盘使用达到水位线,写入失败的报错也不是这个。所以很懵逼,希望有知道原因的大佬能解答一下。
溯源时,排查ES的3个节点磁盘使用率均未达到80%以上过(我们针对ES的磁盘使用是有告警的85%就会触发告警),并未有告警产生。而且磁盘使用达到水位线,写入失败的报错也不是这个。所以很懵逼,希望有知道原因的大佬能解答一下。
2 个回复
Charele - Cisco4321
赞同来自:
即使索引加了这个锁,报的错应该是cluster_block_exception,而不是no such shard之类的
Charele - Cisco4321
赞同来自:
另外你说是3个节点,node-1,-2,-3.
org.elasticsearch.transport.RemoteTransportException: [node-0][192.168.37.105:9311][indices:data/write/bulk[s][r]]
那这里的node-0是什么?