现象:使用ES8.8(向量搜索),会有大索引存在(500G~1T), 变更数据结构时操作删除索引(delete index_name),发现偶发出现节点突然无法加入集群的情况。(节点掉出集群,无法加入,索引暂时又无法被删除,出现red状态,基本无法自愈)
在低版本(6.8,7.17)的数据分析集群(或日志集群),单索引超过1T的情况非常多,delete 索引的时候非常正常。只有在ES8版本下删除带向量字段的index时会出现这种case。(ES8 删除普通日志大索引的case没有测试过)
是否有大佬遇到过类似的case~
在低版本(6.8,7.17)的数据分析集群(或日志集群),单索引超过1T的情况非常多,delete 索引的时候非常正常。只有在ES8版本下删除带向量字段的index时会出现这种case。(ES8 删除普通日志大索引的case没有测试过)
是否有大佬遇到过类似的case~
4 个回复
Charele - Cisco4321
赞同来自:
贴出报错日志
zmc - ES PAAS、JuiceFS
赞同来自:
从无法加入集群的节点(仅data角色节点)拉的日志。
Charele - Cisco4321
赞同来自:
比如a,b,c (它们都有master角色,它们3个中选出master)
x (data角色,等于你报错这台)
如果a,b,c其中挂了1台,那没事。
如果挂了2台,那一台肯定成不了气候。等于集群挂了
在节点x上就会报这个错误。
xxxx-es-data1-16, xxxx-es-master-0”,
xxxx-es-data1-16应该是你本机吧,
xxxx-es-master-0,至少这个没挂。
你要做的事就是找出那些(master角色)的节点为什么挂了
可以找找相应节点下的ES报错,或者系统的日志
shuanglong - 因上努力,果上随缘
赞同来自: