文章 - 搜索客，搜索人自己的社区

6.x 复制片恢复引起flush操作死循环的BUG

⚠️ 截止目前最新的ES6版本6.2.3，存在一个复制片恢复过程中可能引起flush死循环的BUG。我们近期一个ES6.2.2的集群触发了这个bug，导致了一些麻烦。对于写入量很高的集群，这个BUG可能会导致系统的文件描述符被耗尽，结点挂掉，并且重启后依然挂掉的情况。

这个问题发生的时候，必须找到数据目录下，存在大量translog文件的索引目录(可能会有上万的translog文件)，找到对应目录的索引名称，然后关闭复制片，待translog清理完毕以后，再打开复制片重新复制。

该问题有人已经在GITHUB上汇报如下:
issues/29097

BUG已经被确认，修复代码已经进入6.2.4 pull/29125 ，但该版本还未正式release。

准备上6版本的同学先请稍待新版本发布以后再行动，已经在6版本的同学，注意监控结点的FD数量，持续升高的情况需要进行关注。

继续阅读 »

社区日报第240期 (2018-04-13)

1、活久见 | 手机上查询Elasticsearch集群状态
http://t.cn/RmoY9w1
2、Elasticsearch高CPU消耗原因探究
http://t.cn/RmoYNPZ
3、Elasticsearch 写入速度优化到极限
http://t.cn/RWs8yvS

编辑：铭毅天下
归档：https://elasticsearch.cn/article/572
订阅：https://tinyletter.com/elastic-daily

继续阅读 »

终于把2升到6了，分享一下

https://jinleileiking.github.io/post/es6/

希望 wood 大佬能点评一下 @kennywu76

社区日报第239期 (2018-04-12)

filebeat源码分析和grok feature新增。 http://t.cn/Rm6mJJ8
Elasticsearch的轻量级http代理。 http://t.cn/Rm5F6eI
Elasticsearch分布式一致性原理剖析(二)-Meta篇。 http://t.cn/Rm6mjla

继续阅读 »

社区日报第238期 (2018-04-11)

1. 利用ELK处理Docker日志
http://t.cn/RmPvOG7
2. 使用Elasticsearch的44条建议
http://t.cn/RmA5FAC
3. 在Elasticsearch里面使用深度分页功能
http://t.cn/RmiNrdY

编辑：江水
归档：https://elasticsearch.cn/article/569
订阅：https://tinyletter.com/elastic-daily

继续阅读 »

社区日报第237期 (2018-04-10)

1.Elasticsearch分布式一致性原理剖析-节点篇。
http://t.cn/RmIN5RX
2.ELK 系统在中小企业从0到1的落地实践。
http://t.cn/RmIN4C8
3.ES查询流程剖析。
http://t.cn/RmIN2Pt

编辑：叮咚光军
归档：https://elasticsearch.cn/article/568
订阅：https://tinyletter.com/elastic-daily

继续阅读 »

苏州同程艺龙大数据开发工程师、大数据平台开发工程师、数据仓库开发工程师，内推啦，，，

有意向的小伙伴可以加我的微信，在其它平台上投过简历的就不要找我内推了。

社区日报第236期 (2018-04-09)

1.(自备梯子)如何做到每秒一百万写入的es集群基准测试。
http://t.cn/Rm5uw5E

2.elasticsearch5.3.0 bulk index 性能调优实践
http://t.cn/Rm5uEYw

3.kibana 雷达图插件
http://t.cn/Rm5BvcW

编辑：cyberdak
归档：https://elasticsearch.cn/article/566
订阅：https://tinyletter.com/elastic-daily

继续阅读 »

社区日报第235期 (2018-04-08)

1.使用Logz.io和ELK进行AWS成本和使用情况报告分析 - 第2部分。
http://t.cn/RmGDHbc
2.(自备梯子)Logstash是否使用X-PACK。
http://t.cn/RmGezqS
3.(自备梯子)Facebook，告诉我该怎么做！
http://t.cn/RmGkTOQ

编辑：至尊宝
归档：https://elasticsearch.cn/article/565
订阅：https://tinyletter.com/elastic-daily

继续阅读 »

社区日报第234期 (2018-04-06)

1. es同步分片策略解释
http://t.cn/RmUe9yW
2. es深度分页方案
http://t.cn/RmUDSI7
3. 关于为什么lucene在64位系统上要采用mmap的解释
http://t.cn/zj8xz94

编辑: bsll
归档：https://elasticsearch.cn/article/564
订阅：https://tinyletter.com/elastic-daily

继续阅读 »

社区日报第233期 (2018-04-06)

1、Elasticsearch6.X常见操作清单
http://t.cn/Rm2B2Vz
2、Elasticsearch在大规模日志系统的使用经验
http://t.cn/Rm2BHud
3、Elasticsearch分布式一致性原理剖析
http://t.cn/Rm2BGyO

编辑：铭毅天下
归档：https://elasticsearch.cn/article/563
订阅：https://tinyletter.com/elastic-daily

继续阅读 »

社区日报第232期 (2018-04-05)

十亿级索引性能优化的一些小经验总结。 http://t.cn/RmAME9K
ElasticSearch插件开发-Similarity插件。 http://t.cn/RmAM3cY
案例分享：Voxpopme怎么使用elasticsearch获得十倍的性能提升。 http://t.cn/RmAMHin

继续阅读 »

《死磕 Elasticsearch 方法论》：普通程序员高效精进的 10 大狠招！（完整版）

0、授人以渔，少走半年弯路！

死磕 Elasticsearch 方法论：普通程序员高效精进的 10 大狠招！

一、Elasitcsearch基础篇

1.1 Elasitcsearch基础认知

1、Elasticsearch学习，请先看这一篇！

2、Elasticsearch增、删、改、查操作深入详解

3、Elasticsearch 索引存储深入详解

1.2 Elasticsearch集群部署

4、Elasticsearch安装与测试验证详解

5、Elasticsearch windows下一键安装实现深入详解

6、Elasticsearch集群部署详解

7、Elasticsearch5.4.0(head/kibana/logstash)安装部署深入详解

1.3 Elasticsearch 插件安装

8、Elasticsearch插件一——-head插件安装详解

9、Elasticsearch插件二—— kibana插件安装详解

10、Elasticsearch插件三—— Marvel插件安装详解

11、Elasticsearch插件四—— logstash插件安装详解

12、Elasticsearch插件五—— graph插件安装详解

13、Elasticsearch插件六—— 分词 IK analyzer插件安装详解

14、Elasticsearch5.4.0 IK分词插件安装详解

1.4 Elasticsearch小试牛刀

15、ES技术团队划重点 | ES5.X，你必须知道的API和相关技巧

16、Elasticsearch检索分类深入详解—基础篇

17、上线必备 | 高性能ES5.X部署配置清单

18、 Elasticsearch究竟要设置多少分片数？

19、深究｜Elasticsearch单字段支持的最大字符数?

20、Elasticsearch6.X 新类型Join深入详解

二、Elasticsearch进阶篇

2.1 Elasitcsearch数据同步

2.1.1 ES与关系型数据库同步

21、logstash-input-jdbc实现mysql 与elasticsearch实时同步深入详解

22、elasticsearch-jdbc实现MySQL同步到ElasticSearch深入详解

23、go-mysql-elasticsearch实现mysql 与elasticsearch实时同步深入详解

24、mysql 与elasticsearch实时同步常用插件及优缺点对比

25、logstash-input-jdbc 同步原理及相关问题解读

26、 logstash-input-jdbc实现oracle 与elasticsearch实时同步详解

27、logstash一次同步Mysql多张表到ES深入详解

2.1.2 ES与非关系型数据库同步

28、 logstash_output_mongodb插件用途及安装详解

29、 logstash-output-mongodb实现Mysql到Mongodb数据同步

30、logstash-out-mongodb实现elasticsearch到Mongodb的数据同步

31、mongo-connector实现MongoDB与elasticsearch实时同步深入详解

2.1.3 ES与Kafka同步

32、kafka数据同步Elasticsearch深入详解

2.1.4 ES文件同步

33、 Elasticsearch批量导入本地Json文件Java实现

34、logstash实现日志文件同步到elasticsearch深入详解

2.1.5 ES同步小结

35、如何将不同类型数据导入Elaticsearch中？

36、一张图理清楚关系型/非关系型数据库与Elasticsearch同步

2.2 Elasticsearch检索进阶

37、你必须知道的23个最有用的Elasticseaerch检索技巧

38、Elasticsearch实战 | match_phrase搜不出来，怎么办？

2.3 Elasitcsearch聚合进阶

39、 Elasticsearch聚合深入详解——对比Mysql实现

40、Elasticsearch聚合后分页深入详解

41、Elasticsearch聚合优化 | 聚合速度提升5倍

2.4 Elasticsearch Java API 详解

42、 Elasticsearch Java API深入详解

43、Elasticsearch Jest实战深入详解

2.5 Elasitcsearch数据迁移

44、Elasticsearch索引迁移的四种方式

2.6 Elasticsearch性能测试

45、 Elasticsearch自定义脚本完成性能测试

46、Elasticsearch性能测试工具rally深入详解

47、esrally性能分析结果图形化展示深入详解

48、esrally性能测试原理

2.7 Elasitcsearch安全监控

49、Elasticsearch6.2.2 X-Pack部署及使用详解

三、Elasticsearch实战篇

3.1 Elasticsearch应用场景

50、Elasticsearch的使用场景深入详解

51、 Elasticsearch全文检索实战小结

3.2 Elasticsearch架构设计

52、 Elasticsearch实战——全文检索架构设计

53、干货 |《深入理解Elasticsearch》读书笔记

3.3 Elasticsearch项目实战

54、Elasticsearch全文检索系统实现深入详解

55、 Elasticsearch大文件检索性能提升20倍实践（干货）

56、刨根问底 | Elasticsearch 5.X集群多节点角色配置深入详解

57、干货 | Elasticsearch5.X Mapping万能模板

58、干货 | Elasticsearch 集群健康值红色终极解决方案

59、实战 | Elasticsearch打造知识库检索系统

60、Elasticsearch实战 | 必要的时候，还得空间换时间!

61、 Elasticsearch全量数据增量遍历实现原理

62、 Elasticsearch索引增量统计及定时邮件实现

更多干货，持续更新中..... 更新地址：http://t.cn/Rmwzx9t

和你一起，死磕ELK Stack！

继续阅读 »

ES数据备份和清理-快照

这两天在看ES数据备份方面的事情，因为我们ES集群的存储空间有限，需要定时对ES的数据进行备份和清理，把备份的数据存储到其他地方去，然后在ES集群中释放掉。
看大家好多是主要考虑数据的安全性才做的数据的备份，我们就比较low了，我们就是因硬盘不够，要删数据。上个项目是因为日志数据重要程度一般般，就保留了一个月的量，然后也没有做数据的备份转储。这次上线的项目要求就高点了，需要删除的数据存储到其他地方，但是硬盘的容量更低了。所以就需要做ES数据备份和转储，转储完了就清掉。
这里是用ES官方推荐的数据快照方案，这个方案可以完全通过ES API进行操作，比价方便、快捷，在数据恢复方面也是方便的。
先上ES官方的链接，大家看看：https://www.elastic.co/guide/e ... .html
然后就是步骤了：
执行过程分为两部分：
一、准备过程
1、添加ES备份存储目录
在集群的每台机器上进行目录创建
mkdir /home/esdata
2、挂载共享文件存储目录
在集群的每台机器上目录挂载
mount -t nfs 10.70.61.80:/home/apmtest /home/esdata
3、修改ES集群配置
在ES集群的每台机器上都添加path.repo属性
path.repo: ["/home/esdata"]
4、重启ES集群
ES集群重启必须是关闭所有机器后，再启动。
5、建立备份仓库
PUT /_snapshot/my_backup
{
"type": "fs",
"settings": {
"location": "/home/esdata"
}
}

二、备份数据快照
1、通过API执行备份
PUT /_snapshot/my_backup/snapshot_2018.03.01?wait_for_completion=true
{
"indices": "filebeat-2018.03.01"
}

快照仓库需要注意的地方就是需要在整个集群的每一台机器上挂载相同的共享文件存储目录，保证在集群里做的操作是输出到相同的地方的。

下面来一份shell脚本，可以定时执行，是做ES数据的定时转储和清理的，大家可以借鉴一下

#!/bin/bash

ESIP=127.0.0.1

DATE=`date -d '-2 days' +'%Y.%m.%d'`

INDEX='{ "indices": "'$DATE'" }'

echo "begin to backup ES LOG..."

 

curl -XPUT "http://$ESIP:9200/_snapshot/my_backup/snapshot_$DATE?wait_for_completion=true" -d $INDEX

 

echo "----------------------------------------------------------------------------"

 

echo "begin to clean ES LOG..."

 

URL1="http://$ESIP:9200/filebeat-$DATE"

 

curl -XDELETE $URL1



 

echo "TRANSFER AND CLEAN ES LOG END!"

继续阅读 »

这两天在看ES数据备份方面的事情，因为我们ES集群的存储空间有限，需要定时对ES的数据进行备份和清理，把备份的数据存储到其他地方去，然后在ES集群中释放掉。
看大家好多是主要考虑数据的安全性才做的数据的备份，我们就比较low了，我们就是因硬盘不够，要删数据。上个项目是因为日志数据重要程度一般般，就保留了一个月的量，然后也没有做数据的备份转储。这次上线的项目要求就高点了，需要删除的数据存储到其他地方，但是硬盘的容量更低了。所以就需要做ES数据备份和转储，转储完了就清掉。
这里是用ES官方推荐的数据快照方案，这个方案可以完全通过ES API进行操作，比价方便、快捷，在数据恢复方面也是方便的。
先上ES官方的链接，大家看看：https://www.elastic.co/guide/e ... .html
然后就是步骤了：
执行过程分为两部分：
一、准备过程
1、添加ES备份存储目录
在集群的每台机器上进行目录创建
mkdir /home/esdata
2、挂载共享文件存储目录
在集群的每台机器上目录挂载
mount -t nfs 10.70.61.80:/home/apmtest /home/esdata
3、修改ES集群配置
在ES集群的每台机器上都添加path.repo属性
path.repo: ["/home/esdata"]
4、重启ES集群
ES集群重启必须是关闭所有机器后，再启动。
5、建立备份仓库
PUT /_snapshot/my_backup
{
"type": "fs",
"settings": {
"location": "/home/esdata"
}
}

二、备份数据快照
1、通过API执行备份
PUT /_snapshot/my_backup/snapshot_2018.03.01?wait_for_completion=true
{
"indices": "filebeat-2018.03.01"
}

快照仓库需要注意的地方就是需要在整个集群的每一台机器上挂载相同的共享文件存储目录，保证在集群里做的操作是输出到相同的地方的。

下面来一份shell脚本，可以定时执行，是做ES数据的定时转储和清理的，大家可以借鉴一下

#!/bin/bash

ESIP=127.0.0.1

DATE=`date -d '-2 days' +'%Y.%m.%d'`

INDEX='{ "indices": "'$DATE'" }'

echo "begin to backup ES LOG..."

 

curl -XPUT "http://$ESIP:9200/_snapshot/my_backup/snapshot_$DATE?wait_for_completion=true" -d $INDEX

 

echo "----------------------------------------------------------------------------"

 

echo "begin to clean ES LOG..."

 

URL1="http://$ESIP:9200/filebeat-$DATE"

 

curl -XDELETE $URL1



 

echo "TRANSFER AND CLEAN ES LOG END!"

收起阅读 »

社区日报第231期 (2018-04-04)

1. 你有算过在云平台上搭建 Elastic Stack 的成本吗？不妨借鉴下这篇文章的计算思路
http://t.cn/Rm7r18S
2. 如果你要在 kibana 中显示 object 类型数据时遇到问题了，不妨试试这个插件
https://github.com/istresearch ... ormat
3. Elastic{ON} 大会上的 Canvas 技术作品展示细节大曝光！
http://t.cn/Rm7dILR

编辑：rockybean
归档：https://elasticsearch.cn/article/559
订阅：https://tinyletter.com/elastic-daily

继续阅读 »