你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

海量数据导入elasticsearch优化

Elasticsearch | 作者 SongJianjun | 发布于2017年11月23日 | 阅读数：9233

分享到：QQ空间新浪微博微信 QQ好友印象笔记有道云笔记

需求：
存储2000台openstack计算节点的nova，ceilometer，neutron的日志。
部署方式：
1.批量部署logstash到2000台计算节点上，采集数据发送到redis缓存（单节点）
2.es集群3节点（node.master: true，node.data: true），版本：1.7.1；es的配置见附件。
3.同时启动24个logstash消费节点，分布在3台物理服务器上，从redis消费，写入es中。平均每个es节点对应8个logstash的写入。
问题：
会有近1亿多的数据积压在redis中。
请问各位大神，如何进行定位和优化，谢谢！
ps：该环境中，es的查询性能可以忽略。

yml.zip

9 个回复

赞同来自: medcl 、laoyang360

对。如果是新部署，可以用最新的elk啊。性能等提升了不少。也方便了很多。

lz8086 - es小司机

赞同来自: horizon3d

个人使用来看，ruby写的logstash性能并不高，因此原作者才用golang开发了filebeat

xiaoke - http://blog.51cto.com/kexiaoke

ES版本，1.7.1？？？？？？？？？？

这种问题，我通常就是排查一下，资源使用情况，是cpu满了，还是io满了，或者带宽。这些都是瓶颈。如果这些都正常，es索引能力应该还可以提升。可以提高并发，或者建立多个index等等。

墙裂建议升级版本

80%的可能是你ES的IO跟不上。监控下ES的磁盘IO。
优化方面1，跳转下bulk大小。内存大的话就调大点
2，把副本取消，不要副本
3，提高refresh_internal的时间
4，增大的你等待队列长度
等等
根据自身进行跳转

medcl - 今晚打老虎。

同样建议先升级再考虑优化

你先说下每台logstash 每秒接多少条数据再列一下 3台es机器的硬件配置 cpu线程数物理内存大小磁盘型号几块盘 IOPS多少就能大致知道集群能否扛得住

laoyang360 - 《一本书讲透Elasticsearch》作者，Elastic认证工程师 [死磕Elasitcsearch]知识星球地址：http://t.cn/RmwM3N9；微信公众号：铭毅天下; 博客：https://elastic.blog.csdn.net

也是建议先升级

要回复问题请先登录或注册