是时候用 ES 拯救发际线啦

ilm里关于shrink操作的疑问

Elasticsearch | 作者 wangxinrong | 发布于2021年03月03日 | 阅读数:1281

shrink是ilm里的一个选项,然后ilm一般是管理日志这样的时序数据的索引的,那么这个shrink操作的意义在哪里呢?
 
按天、按小时创建索引,有一个好处就是能在搜索时,缩小查询范围,提高性能。例如按小时建索引,避免查最近1小时数据时,去搜一整天的数据。因为最近1小时的数据只在最新的分片里才有。如果这时用shrink把最近一天的分片都合成一个分片了,那么这个搜索范围不就扩大了,性能降低了么。
 
另外我们在rollover的时候,已经指定了单个分片的大小,比如30G或者50G一个分片,如果再做shrink的话,合成了一个更大的几百G的分片,不是也不符合建议的配置么。
已邀请:

Charele - Cisco4321

赞同来自:

shrink和split并不是ILM里专有的,是一个平常操作。只不过ILM里带了而已。
至于你说的shrink功能没有用,分分合合,每个人的需求不一样,就像结婚离婚一样,

wangxinrong

赞同来自:

不知道是不是因为indexing阶段分片数设置多一些,写入性能会比较高,或者当数据量比较小的时候,容易出现小的分片。需要做shrink。

要回复问题请先登录注册