好的想法是十分钱一打,真正无价的是能够实现这些想法的人。

如何控制日志导入ElasticSearch之后的体积?

Elasticsearch | 作者 qwefdrt | 发布于2018年05月21日 | 阅读数:2486

假设一天的日志为1G,通过logstash分字段,导入es后,当天该日志的索引大小为日志总量的6到7倍。
请问各位大神,是什么原因导致的?有什么优化方法吗?
已邀请:

yayg2008

赞同来自: medcl

1,设置恰当的mapping,如楼上所说text是会分词,然后会占用很多的空间;
2,控制副本数,随着副本增加,占用空间会成倍增加。

JElbert - es菜鸟选手

赞同来自:

体积是什么概念

laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net

赞同来自:

多半是分词导致的,ES默认string是text和keyword两种类型,如果不需要可以去掉其中一种。

xinfanwang

赞同来自:

keyword不分词。如果不需要分词,直接用keyword。

wajika

赞同来自:

如何设置mapping?去掉text?

要回复问题请先登录注册