目前我们ES集群,默认只打开最近3天的索引,更早的索引会保持关闭状态,保存3-6个月以后删除
如果有查询3天前数据的需求,会单独打开对应日期的索引,查询后关闭,我想基本上大部分人也都是这么做的
如果现在有需求,要统计整个3-6个月这段时间的数据,或者不确定具体日期,要在半年的范围内查询一条日志,如果一天的索引有1T或者更大数据量的话,这样基本上没办法做到,全部打开这些索引会占用大量时间、系统资源,并且数据量太大服务器资源无法支持一次查询
请问这种情况,要怎么实现呢,是否还适合用ES,如果可以的话一般怎么做呢?
我见过有的是把历史数据存到hive、 impala等大数据平台中进行查询,另外阿里云的日志服务也可以一直保持所有日志打开状态供查询,不知道是不是用的ES服务
如果有查询3天前数据的需求,会单独打开对应日期的索引,查询后关闭,我想基本上大部分人也都是这么做的
如果现在有需求,要统计整个3-6个月这段时间的数据,或者不确定具体日期,要在半年的范围内查询一条日志,如果一天的索引有1T或者更大数据量的话,这样基本上没办法做到,全部打开这些索引会占用大量时间、系统资源,并且数据量太大服务器资源无法支持一次查询
请问这种情况,要怎么实现呢,是否还适合用ES,如果可以的话一般怎么做呢?
我见过有的是把历史数据存到hive、 impala等大数据平台中进行查询,另外阿里云的日志服务也可以一直保持所有日志打开状态供查询,不知道是不是用的ES服务
7 个回复
trycatchfinal
赞同来自:
不知道是否满足你的需求
wangxinrong
赞同来自:
cyfcooler
赞同来自:
2. 通过应用程序来分批查不同天的索引, 然后做聚合.
locatelli
赞同来自:
sun_changlong
赞同来自:
wangxinrong
赞同来自:
wangxinrong
赞同来自: