使用netstat -lntp来看看有侦听在网络某端口的进程。当然,也可以使用 lsof。

es批量替换数据时,磁盘空间会一直增加?

Elasticsearch | 作者 yqbboy | 发布于2018年06月04日 | 阅读数:3342

我把udas_now_1里的数据经过清洗后倒入到另外一个索引中,我在持续的跑这部分数据时,会发现我的目标索引(也就是图里的yanqiang2,源索引是:udas_now_1)磁盘空间会一直增大,我对比了一下这两个索引数据条数是一样的,目标索引会随着我重复的跑数据,进而删除的数据增多(之所以会有删除的数据是因为_id一样,当从源索引迁移到目标索引时,如果_id一样就会替换,也就是先删除后插入,我想大家都明白这个地方)。问题就是,我不理解这个多出来的磁盘空间是谁占用的?
es1.png
已邀请:

medcl - 今晚打老虎。

赞同来自:

删除的数据还在,只是标记为删除,在 merge 操作之前,是继续占磁盘的。

lxq - 93年,java

赞同来自:

在合并索引段后,就没事了

要回复问题请先登录注册