身安不如心安,屋宽不如心宽 。

关于SSD的使用场景

Elasticsearch | 作者 pqy | 发布于2018年06月07日 | 阅读数:1281

大家好请教一个问题,写入量很小(每秒大概200-500条doc左右,每日500-1000万doc、10G左右)、聚合业务很多(集群索引25T左右,最大14T(主副本)),有没有必要使用SSD,优势有哪些..(每日写入量很小的情况下)
已邀请:

zqc0512 - andy zhou

赞同来自: medcl

关键是查询,你查询能够等待的时间是多少?单个查询能够包括多少数据量,几个副本?
多少节点,这些都有影响的。
查询的话,多节点,多副本能够提供命中率的。

pqy

赞同来自:

如果换成普通磁盘的话,成本节省三分之一左右.. SSD 对查询、聚合的提升大不大,对索引速度要求不高..

pqy

赞同来自:

@zqc0512 感谢
1、查询的要求不高,对查询大部分的场景是使用 scroll 导出指定数据后作分析,根据 keyword 字段 + match_phrase 获取结果。基本没有要求毫秒级别的查询 ,实时返回查询结果的场景只有 kibana.. 
2、所有的单个查询都会有时间范围限定,每个索引都只有1个副本(最大的索引 主分片7.8T ) 、25个data node ,es 5.4.0
3、业务上对es的时候场景只有两种 scroll数据导出 + 大量各种聚合计算(目前使用没有问题),对查询要求和索引速度要求都比较低 

要回复问题请先登录注册