不要急,总有办法的

dense_vector的关闭_source和开启_source的索引磁盘空间占比为1:3.6,为什么该类型_source占用磁盘空间这么大?

匿名 | 发布于2023年02月28日 | 阅读数:3253

es版本:elasticsearch-7.15.2 
对比索引只有一个字段,类型为“dense_vector”,关闭_source时与开启_source后大小比例基本为1:3.6,用两批数据测试的,都是这个比例,为什么"dense_vector"的_source占用磁盘空间这么大呢。
mapping如下:
"mappings": {
    "_doc": {
        "properties": {
            "dataEncode": {
                "dims": 100,
                "type": "dense_vector"
           }
       }
   }
}
开启_source

vector开启_source.png

关闭_source

vector未开启_source.png

 
已邀请:

Ombres

赞同来自:

看你的场景,souce中是字符串形式的存储的向量,即使通过压缩占用空间也比较大。 而索引中的向量则不是。

charlesfang

赞同来自:

_source开启和关闭是存和不存储数据内容的区别,你关闭了不存数据了,空间当然就小了

要回复问题请先登录注册