极限数据平台 v0.2 发布了

极限数据 v0.2 版本正式发布了。
1. 新增了各个维度的监控指标，重新组织了各个指标的分组信息；
2.开发工具支持快捷键调出和隐藏；
3.指标索引支持 ILM 生命周期管理；
4.完善国际化的部分翻译；
5.修复了一些 Bug；

下载地址：
http://release.elasticsearch.cn/console/stable/

更多详细信息，请查看文档地址：http://极限数据.com

继续阅读 »

社区日报第1269期 (2021-12-03）

1、优化 Elasticsearch 中的排序查询以获得更快的结果
https://www.elastic.co/cn/blog ... sults
2、Elasticsearch 机器学习获取更好相关性插件
https://github.com/o19s/elasti ... -rank
3、在 Elastic Cloud on Kubernetes (ECK) 上部署 Elasticsearch 的详细指南
https://medium.com/99dotco/a-d ... 60466

编辑：铭毅天下
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1268期 (2021-12-02）

1.Elasticsearch 在电商搜索中的应用
https://spinscale.de/posts/202 ... .html
2. 完美避坑！记一次Elasticsearch集群迁移架构实战
https://cloud.tencent.com/developer/news/643210
3.使用 Prometheus + Grafana 监控 Elasticsearch
https://www.cnblogs.com/caowei ... .html

编辑：Se7en
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1267期 (2021-12-01)

1.由Elasticsearch的API命令，引发的金融业生产故障
https://mp.weixin.qq.com/s/8IFc_4ZjDtlMnkyHum-iAg
2. 缓存及使用 Circuit Breaker 限制内存使用
https://learnku.com/articles/41595
3. Top 10 Elasticsearch Metrics to Monitor
https://sematext.com/blog/top- ... atch/

编辑：kin122
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

Elasticsearch 内存占用分析及 page cache 监控

前言

对于广大 Elasticsearch 使用者而言，在面对系统资源分配、问题请求排查时是否曾遇到以下问题：

只知道需要预留许多内存资源给 lucene（一般为系统资源的一半），但是分配的这些是否够用，以及这些内存资源被什么文件所占用，往往都不得而知；
线上服务突然出现一波超时告警，告警波及的索引面积较广，但波动具体由哪个索引，甚至哪个查询导致的，在排查时容易陷入无从下手的困境。

通常在 Elasticsearch 的监控层面，我们会选择去查看 kibana 的监控报表，但 kibana 在内存方面的监控指标通常都基于 JVM 本身，无法追溯到 lucene 层面。而 lucene 的文件使用的是操作系统的 page cache，如何监控 page cache，并将之映射到 Elasticsearch 的索引维度，便是本文着手解决的问题。

接下来本文将分为三个主要部分，第一部分介绍和 Elasticsearch 内存使用相关的基础知识，适合对 ES 内存资源占用有兴趣的同学，第二部分介绍 Elasticsearch 的 page cache 监控工具和使用说明，第三部分列举一些典型的使用案例。

基础知识

对搜索引擎而言，各级缓存的命中率和查询效率密切相关。ES 的缓存主要由 JVM 堆内存，以及 lucene 所依赖的堆外内存两部分组成。考虑到大多数查询场景的多样性，ES 的 query cache 覆盖能力有限，因此 ES 的查询性能和 lucene 各类文件的缓存状况息息相关，能否通过 page cache 尽量减少查询过程中产生的文件IO 将直接影响到查询效率。本节将从 Elasticsearch 内存分布，lucene 文件类型和使用场景，文件读取方式几个层面展开介绍。

Elasticsearch 内存相关

ES 进程的 JVM 堆内存主要包括以下几部分内容（不详细展开）

Indexing Buffer：索引缓冲区，用于存储新索引的文档，当其达到阈值时，会触发 ES flush 将段落到磁盘上；
Fielddata：用于 text 字段分词或排序时获取字段值，基于 lucene 的 segment 构建，伴随 segment 生命周期常驻在堆内存中。
Node Query Cache：负责缓存 filter 查询结果，基于 lucene 的 segment 构建，缓存在堆内存中，ES 节点默认的 cache 大小为堆内存的10%，采用LRU机制。
Shard Request Cache：针对 ES 的 query 请求，缓存各分片的查询结果，主要用于缓存聚合结果，采用LRU机制，当分片 refresh 后会失效。

对于 lucene 而言，其使用的是堆外内存

Page Cache：lucene 读写段文件时会依赖操作系统的 page cache 缓存，如果多次查询都涉及到读取某个段文件的同一部分内容，就直接使用 page cache 进行读取，无需再从磁盘获取数据。page cahce 由操作系统管理，淘汰策略类似LRU。
lucene 文件类型

ES 的一个分片就是一个 lucene 实例，实例由一个或多个 segment 构成。lucene 每次 flush 操作都会对一个 segment 进行持久化操作（会将内存中的 segment 写到文件，但不执行 FileChannel::force，即存在数据丢失的可能），其内容为期间有变更的文档，同一个段涉及到的文件前缀都是相同的 generation（36进制的一个数字，每次 flush 会加一），每个段可能涉及到的文件如下表所示。

文件后缀	存放信息	关联 ES 的查询场景
.tip	词典的fst，以及到.tim的索引	term查询、全文搜索等场景
.tim	存放term info以及指向.doc、.pos、.pay的指针	term查询、全文搜索等场景
.doc	倒排表及词频
.pos	记录term的位置信息	match_pharse等需要位置信息的查询
.pay	payload信息
.fdt	存放原始文档，正向存储	获取source等字段值
.fdx	fdt的索引
.dvd	DocValues 列式存储	聚合、排序、脚本等场景
数值类型的range查询
.dvm	.dvd的索引
.nvd	Norms data	全文搜索的tfNorms计算
.nvm	.nvd的索引
.dim	数值类型的索引，BKD树结构	数值类型的range查询
.dii	.dim的索引
.liv	记录被删除的文档号
.cfs	复合文件	新写入数据生成的段文件，引入该文件主要用于减少文件句柄数
.cfe	复合文件，.cfs的索引
.si	记录段的元信息

lucene 文件功能说明备注

tip 和 fdx 类型的文件在 ES 7.3 以前都是常驻 JVM 堆内存的，ES 7.3 之后将 fst 移至堆外，交由系统的 page cache 管理，若某个索引的 fst cache 不幸被置换出去，理论上会给搜索带来较大的抖动，对于使用 7.x 版本的用户，建议多关注 tip 文件的 cache 情况；
上述文件中占用存储空间较多的是 tim、doc、fdt、dvd 以及 cfs 这几类数据文件，除 cfs 以外的几类文件加载情况和查询条件密切相关；
range 查询即可能使用 dim BKD 索引，也可能使用 dvd DocValue，其背后是一个基于代价的优化器处理逻辑，如有兴趣，细节逻辑可自行参考 IndexOrDocValuesQuery。

lucene 文件读取方式

lucene 文件的读取方式将影响磁盘 IO 调用，以及 page cache 中缓存的内容，常用的主要是如下两种类型：
niofs：通过 NIO 的方式读取文件内容，基于 Java 提供的 FileChannel::read 方法读取数据，支持多线程读取同一个文件，按需读取，需要注意的是 niofs 模式下读取到的内容在系统层面也会进 page cache。
mmapfs：通过mmap读写文件，会比常规文件读写方式减少一次内存拷贝的过程，因此对于命中 page cache 的文件读取会非常快，该模式即零拷贝的一种实现（可减少内核态和用户态间的数据拷贝）。不过 mmap 系统调用在内核层面会产生预读，对于 .fdt 这类文件，预读读到的内容后续命中的概率极低，还容易引起page cache的争用，进而产生频繁的缺页中断，相关问题可参考 https://github.com/elastic/elasticsearch/issues/27748

ES 支持通过 index.store.type 设定文件加载方式

ES 6.*版本默认为 mmapfs
ES 7.0开始默认为 hybridfs，该模式下每类文件会选择最优的读取方式，例如 .doc 由于倒排表的缓存命中率较高，被设定为 mmapfs，而 .fdt 只在获取 _source 时使用，访问较为稀疏，被设定为 niofs。
工具使用说明

综上所述，lucene 各类文件占用 page cache 的情况将极大的影响 Elasticsearch 的查询效率，如何系统的监控各类文件在 page cache 中的占用，以及换入换出的波动，将为 ES 的资源分析和性能监控提供一种新的角度。

如果想采集系统的 page cache，可以借助 pcstat、vmtouch 等工具，其实现原理均是通过 mincore(2) 系统调用，mincore能确定一块虚拟内存区域中的分页是否驻留在物理内存中。其中 pcstat 是款基于Go的开源工具（https://github.com/tobert/pcstat），开发初衷是用于监控 Cassandra 中 ssTables 的占用情况。

本工具 es-pcstat 基于 pcstat 进行二次开发，以 ES 索引为维度，细化到 lucene 文件的粒度来对 page cache 占用情况进行采集，可对cfs、fdt、doc、pos、tim、dvd等重要文件进行细粒度的采集和监控。支持数据输出到控制台、日志、ES，配套kibana仪表盘支持查看各索引、各类文件的时序变化曲线。

源码地址

https://github.com/zhangdapao995/es-pcstat

功能点

采集目标：ES索引下各类 lucene 文件的 page cache 占用，单位MB，默认采集全部索引，支持配置采集的索引前缀。

运行环境

系统环境：类unix、linux环境
ES 版本：6.x、7.x

功能项

数据输出：控制台、日志和ES
- 控制台：查看各索引 cache，支持排序
- 日志和ES：采集维度从上到下依次为节点->索引->主副分片->文件后缀
可视化：数据输出为 ES 时，支持 kibana 仪表盘配置
- 支持按节点、索引、主副分片类型筛选查看
- 支持查看索引 page cache top10 波动曲线

获取可执行文件

linux_x64

linux 64位可通过如下命令获取可执行文件

curl -L -o es-pcstat https://gitee.com/verdant/es-pcstat/attach_files/835465/download/es-pcstat-linux-x64
chmod 755 es-pcstat

mac

mac 64位可通过如下命令获取可执行文件

curl -L -o es-pcstat https://gitee.com/verdant/es-pcstat/attach_files/835463/download/es-pcstat-darwin-x64
chmod 755 es-pcstat

运行

执行命令

./es-pcstat [parameters] <config_file>

例：./es-pcstat -collectIntervalFlag=30 -sortFlag=true ./es.conf

运行可选参数

  -collectIntervalFlag int
        采集间隔 (default 60)
  -outputTypeFlag string
        数据输出方式 [es, log, console] (default "console")
  -sortFlag
        仅对console类型生效，结果按page cache大小排序

配置文件

配置文件需填写es ip、端口、节点名、集群名和数据目录，其中path需要填写indices目录，一般为es的 data.path配置后增加"/nodes/0/indices"。

名称	描述	默认值
es.ip	采集的es节点ip
es.port	采集的es节点端口
es.indicesPath	采集的es节点indices目录，一般为"${data.path}/nodes/0/indices"
es.nodeName	采集的es节点名
es.clusterName	采集的es集群名
es.collection.indicesPrefix	需采集的索引名前缀，不填则采集全部；样例：pcstat
output.log.keepLogNum	针对日志形式输出生效，保留日志文件个数（按天拆分）	5
output.log.logPath	针对日志形式输出生效，日志全路径	/tmp/pcstat.log
output.es.keepIndexNum	针对es输出生效，保留索引个数（按天拆分）	5
output.es.pcIndexName	针对es输出生效，索引名（如需使用kibana仪表盘配置请勿修改）	pc_stat

#es conf
es.ip=127.0.0.1
es.port=9200
es.indicesPath=/xxx/xxx/elasticsearch-6.7.1/data/nodes/0/indices
es.nodeName=node1
es.clusterName=es_local

#采集索引前缀,设置为空则采集全部
es.collection.indicesPrefix=

#该配置仅日志输出生效 output log,保留个数单位为天
output.log.keepLogNum=5
output.log.logPath=/tmp/pcstat.log

#该配置仅es输出生效 output es,保留个数单位为天
output.es.keepIndexNum=5
output.es.pcIndexName=pc_stat

输出模式

控制台输出

执行命令

./es-pcstat -collectIntervalFlag=30 -sortFlag=true ./es.conf

结果示例


| index_name                            | cache (MB) | pri cache  | rep cache  |
+---------------------------------------+------------+------------+------------+
| fusion-media.task.task                |  247       |  247       |  0         |
| total                                 |  247       |  247       |  0         |
+---------------------------------------+------------+------------+------------+

日志输出

执行命令

./es-pcstat -outputTypeFlag=log ./es.conf

对应日志文件得到的内容，日志可进一步通过日志服务采集分析（如阿里云sls等）

{"cache":{"cfs":0,"dim":0,"doc":0,"dvd":0,"fdt":0,"nvd":0,"other":0,"pos":0,"tim":0,"total":0},"cluster_name":"es_local","fields.time":"2021-05-06T15:16:30.525475+08:00","index_name":"total","level":"info","msg":"","node_name":"node1","primary":false,"time":"2021-05-06T15:16:30"}

ES 输出

执行命令

./es-pcstat -outputTypeFlag=es ./es.conf

运行后会将采集到的数据回写到被监控的 ES 集群可导入kibana仪表盘配置文件es-pcstat-kibana.json，通过图表进行page cache分析。

导入方式

图1 kibana导入仪表盘配置

导入后打开dashboards菜单栏，page_cache仪表盘

图2 kibana仪表盘入口

细节可查看如下图表 1）cache占用top10的索引波动图

图3 kibana仪表盘-cache top10

2）cache详细信息，可筛选节点、索引、主副分片，不选择展示合计数据。

图4 kibana仪表盘-cache占用详情

备注

如需使用上述kibana仪表盘导入文件，请勿修改conf文件中的output.es.pcIndexName以及运行命令的collectIntervalFlag，修改output.es.pcIndexName会导致仪表盘读不到数据，修改collectIntervalFlag会导致仪表盘聚合数据异常；
kibana7.5后Date Histogram的interval有所调整，会导致时间拉长后interval成倍增大，统计值不准，建议选取时间范围在4-6小时内，https://elasticsearch.cn/question/11062
使用案例

通过 es-pcstat 采集得到的 page cache 时序图，可为性能监控、资源分析、异常请求定位等问题提供一定帮助，以下将从笔者团队使用中的几个案例进行展开。

一个简单示例：每条横线代表一个索引的所有 lucene 文件资源占用，一小时内的采样可以发现两个转折点

1 触发了副本清0操作，由于该集群副本不涉及搜索，所占用的内存比例较少
2 触发了一些查询请求，部分索引所占资源上涨

图5 索引资源波动-基于阿里云sls仪表盘

案例一：资源分析

通过观察一段时间的资源波动可评估预留给 lucene 的 page cache 是否充裕，如下两张图展示了两个集群中单个节点一天的资源占用情况，图6资源较为充裕，整体趋势几乎无大的波动，图7资源较为紧张，频繁出现 page cache 的换入换出。

图6 索引内存资源评估-充足

图7 索引内存资源评估-不足

案例二：merge的影响

如图8所示，通过监控可以发现某个索引的 page cache 上涨非常明显，导致其他索引的资源被换出，这种抢占会导致搜索服务波动；通过kibana排查该时间段内该索引的监控，发现段的数量有所下降，查看段文件后发现在该时间段后生成了几个较大的段文件，判定是 merge 导致 page cache 上涨，通过图9可以看到 merge 过程中 fdt 文件的上涨尤其明显（主要因为 merge 需要 load 原始内容进行处理），merge 完成后 fdt 的 cache 会慢慢的换出。

由于采用了存储计算分离的架构，后续可考虑将数据规模达到一定阈值的 merge 操作移到专属的 merge 节点处理，以此减少 merge 引起的 cache 换入换出对搜索服务节点带来的波动。

图8 整体资源波动，某个索引资源迅速上涨

图9 引起问题的索引波动，fdt上涨尤为明显

案例三：异常查询请求定位

有时集群的整体响应突然变慢，却不知道是由哪个索引、或哪个查询引起的？

例如某天一个 ES 集群突然出现大量超时请求，查看节点监控，ygc有所下降，cpu利用率一直在高位；再查看磁盘监控，发现磁盘读吞吐处于高负荷状态。

图10 异常请求引起的磁盘IO满负荷

通过这些常规的监控无法进一步定位到异常原因，再来看看 page cache 的监控。根据“索引cache top N”图表可以明显发现异常时间点有个索引的cache大幅度上涨，其他索引的 cache 都有所下降，在异常时间段内，曲线的毛刺极为明显，由此可以判断是堆外内存不够，导致各索引的 page cache 出现争用，进而需要从磁盘上获取数据。

图11 索引内存资源占用波动-top10

再进一步查看 cache 上涨期间问题索引各类文件的 cache 情况，可看到 doc和pos 有明显上涨，doc文件存储倒排表及词频，由包含每个 term 以及频率的 docs 列表组成，pos 存储出现在索引中 term 的位置信息。二者在 phrase 查询中会被联合使用。当一个平时使用率不高的索引突然出现了大量的 phrase 查询，内存资源比较吃紧（该节点预留给堆外的只有7 GB），进而就产生了上述问题。

图12 索引内存资源占用波动-异常索引详情

对于某些突发的，却给集群造成较大压力的请求，可以尝试通过 page cache 监控去排查定位。

当然要把具体的 lucene 文件类型变化趋势和查询关联起来，需要对各类查询涉及的文件有一定了解，相关细节可查看“基础知识->lucene 文件类型”一节，典型的如

dvd 上涨可以猜测是有聚合、脚本、排序的请求
doc、pos上涨可以联想到是否有 phrase 查询请求
fdt 上涨可能涉及大量的源数据拉取或 merge 操作

案例四：为性能优化制定方向

随着系统的发展、数据量的增长，在某个业务场景 ES 相关的资源和效率可能逐渐成为瓶颈，这时候我们就需要从底层视角来推动上层的优化，如图13所示，根据监控曲线可发现 fdt、doc、pos 几类文件的常驻内存资源较多，便可从这3类文件的使用情况出发来制定优化方向：

fdt 常用于获取_source字段的内容，如果存储并在查询结果中获取大量字段很容易导致该文件频繁访问，进而占用较多资源，可以考虑对 _source 进行适当删减，或将数据获取逻辑移至宽表数据库，如HBase等，让 ES 的资源更多的用于搜索本身；
doc 在 term 和全文搜索场景均有使用，这类文件的加载通常不可避免，可以从降低文件大小来入手，如在分词层面进行优化，对词的分布进行统计分析，来评估是否可以补充停用词等；
pos 用于需要位置信息的 phrase 查询，可从查询语句的拼装进行优化。

图13 观察内存资源占用来制定优化方向

总结及未来展望

es-pcstat 从 ES 索引和 lucene 各类文件 page cache 占用的角度，提供了一种对 ES 进行监控的全新思路，基于这些监控数据我们可以进行资源的饱和度评估，异常查询请求的定位，或者为性能优化制定方向。

当然异常请求的定位都只能限于事后分析，无法避免问题的产生，如何通过监控数据和查询请求去评估一个 query 可能对集群产生的影响，并拦截可能导致较大 page cache 争用的请求，这将能为集群的稳定性提供更大的保障。

es-pcstat 采集细化到了 lucene 文件的粒度，需要具备一定基础知识和经验才能快速定位背后原因，因此在分析上具备一定门槛，如果能根据文件波动来为监控者提供一些 ES 层面的提示，将能服务更广大的 ES 用户。

在 ES 中对一个查询的成本（涉及JVM中的缓存、系统内存缺页中断、IO、CPU等）进行评估本身是一件比较难的事，page cache 的监控可能能提供一定的帮助，当然还有更多的作用等待我们去探索。

参考链接

https://github.com/tobert/pcstat
https://www.amazingkoala.com.cn/Lucene/2019/1205/115.html
https://www.elastic.co/guide/en/elasticsearch/reference/master/index-modules-store.html

继续阅读 »

前言

对于广大 Elasticsearch 使用者而言，在面对系统资源分配、问题请求排查时是否曾遇到以下问题：

只知道需要预留许多内存资源给 lucene（一般为系统资源的一半），但是分配的这些是否够用，以及这些内存资源被什么文件所占用，往往都不得而知；
线上服务突然出现一波超时告警，告警波及的索引面积较广，但波动具体由哪个索引，甚至哪个查询导致的，在排查时容易陷入无从下手的困境。

通常在 Elasticsearch 的监控层面，我们会选择去查看 kibana 的监控报表，但 kibana 在内存方面的监控指标通常都基于 JVM 本身，无法追溯到 lucene 层面。而 lucene 的文件使用的是操作系统的 page cache，如何监控 page cache，并将之映射到 Elasticsearch 的索引维度，便是本文着手解决的问题。

接下来本文将分为三个主要部分，第一部分介绍和 Elasticsearch 内存使用相关的基础知识，适合对 ES 内存资源占用有兴趣的同学，第二部分介绍 Elasticsearch 的 page cache 监控工具和使用说明，第三部分列举一些典型的使用案例。

基础知识

对搜索引擎而言，各级缓存的命中率和查询效率密切相关。ES 的缓存主要由 JVM 堆内存，以及 lucene 所依赖的堆外内存两部分组成。考虑到大多数查询场景的多样性，ES 的 query cache 覆盖能力有限，因此 ES 的查询性能和 lucene 各类文件的缓存状况息息相关，能否通过 page cache 尽量减少查询过程中产生的文件IO 将直接影响到查询效率。本节将从 Elasticsearch 内存分布，lucene 文件类型和使用场景，文件读取方式几个层面展开介绍。

Elasticsearch 内存相关

ES 进程的 JVM 堆内存主要包括以下几部分内容（不详细展开）

Indexing Buffer：索引缓冲区，用于存储新索引的文档，当其达到阈值时，会触发 ES flush 将段落到磁盘上；
Fielddata：用于 text 字段分词或排序时获取字段值，基于 lucene 的 segment 构建，伴随 segment 生命周期常驻在堆内存中。
Node Query Cache：负责缓存 filter 查询结果，基于 lucene 的 segment 构建，缓存在堆内存中，ES 节点默认的 cache 大小为堆内存的10%，采用LRU机制。
Shard Request Cache：针对 ES 的 query 请求，缓存各分片的查询结果，主要用于缓存聚合结果，采用LRU机制，当分片 refresh 后会失效。

对于 lucene 而言，其使用的是堆外内存

Page Cache：lucene 读写段文件时会依赖操作系统的 page cache 缓存，如果多次查询都涉及到读取某个段文件的同一部分内容，就直接使用 page cache 进行读取，无需再从磁盘获取数据。page cahce 由操作系统管理，淘汰策略类似LRU。
lucene 文件类型

ES 的一个分片就是一个 lucene 实例，实例由一个或多个 segment 构成。lucene 每次 flush 操作都会对一个 segment 进行持久化操作（会将内存中的 segment 写到文件，但不执行 FileChannel::force，即存在数据丢失的可能），其内容为期间有变更的文档，同一个段涉及到的文件前缀都是相同的 generation（36进制的一个数字，每次 flush 会加一），每个段可能涉及到的文件如下表所示。

文件后缀	存放信息	关联 ES 的查询场景
.tip	词典的fst，以及到.tim的索引	term查询、全文搜索等场景
.tim	存放term info以及指向.doc、.pos、.pay的指针	term查询、全文搜索等场景
.doc	倒排表及词频
.pos	记录term的位置信息	match_pharse等需要位置信息的查询
.pay	payload信息
.fdt	存放原始文档，正向存储	获取source等字段值
.fdx	fdt的索引
.dvd	DocValues 列式存储	聚合、排序、脚本等场景
数值类型的range查询
.dvm	.dvd的索引
.nvd	Norms data	全文搜索的tfNorms计算
.nvm	.nvd的索引
.dim	数值类型的索引，BKD树结构	数值类型的range查询
.dii	.dim的索引
.liv	记录被删除的文档号
.cfs	复合文件	新写入数据生成的段文件，引入该文件主要用于减少文件句柄数
.cfe	复合文件，.cfs的索引
.si	记录段的元信息

lucene 文件功能说明备注

tip 和 fdx 类型的文件在 ES 7.3 以前都是常驻 JVM 堆内存的，ES 7.3 之后将 fst 移至堆外，交由系统的 page cache 管理，若某个索引的 fst cache 不幸被置换出去，理论上会给搜索带来较大的抖动，对于使用 7.x 版本的用户，建议多关注 tip 文件的 cache 情况；
上述文件中占用存储空间较多的是 tim、doc、fdt、dvd 以及 cfs 这几类数据文件，除 cfs 以外的几类文件加载情况和查询条件密切相关；
range 查询即可能使用 dim BKD 索引，也可能使用 dvd DocValue，其背后是一个基于代价的优化器处理逻辑，如有兴趣，细节逻辑可自行参考 IndexOrDocValuesQuery。

lucene 文件读取方式

lucene 文件的读取方式将影响磁盘 IO 调用，以及 page cache 中缓存的内容，常用的主要是如下两种类型：
niofs：通过 NIO 的方式读取文件内容，基于 Java 提供的 FileChannel::read 方法读取数据，支持多线程读取同一个文件，按需读取，需要注意的是 niofs 模式下读取到的内容在系统层面也会进 page cache。
mmapfs：通过mmap读写文件，会比常规文件读写方式减少一次内存拷贝的过程，因此对于命中 page cache 的文件读取会非常快，该模式即零拷贝的一种实现（可减少内核态和用户态间的数据拷贝）。不过 mmap 系统调用在内核层面会产生预读，对于 .fdt 这类文件，预读读到的内容后续命中的概率极低，还容易引起page cache的争用，进而产生频繁的缺页中断，相关问题可参考 https://github.com/elastic/elasticsearch/issues/27748

ES 支持通过 index.store.type 设定文件加载方式

ES 6.*版本默认为 mmapfs
ES 7.0开始默认为 hybridfs，该模式下每类文件会选择最优的读取方式，例如 .doc 由于倒排表的缓存命中率较高，被设定为 mmapfs，而 .fdt 只在获取 _source 时使用，访问较为稀疏，被设定为 niofs。
工具使用说明

综上所述，lucene 各类文件占用 page cache 的情况将极大的影响 Elasticsearch 的查询效率，如何系统的监控各类文件在 page cache 中的占用，以及换入换出的波动，将为 ES 的资源分析和性能监控提供一种新的角度。

如果想采集系统的 page cache，可以借助 pcstat、vmtouch 等工具，其实现原理均是通过 mincore(2) 系统调用，mincore能确定一块虚拟内存区域中的分页是否驻留在物理内存中。其中 pcstat 是款基于Go的开源工具（https://github.com/tobert/pcstat），开发初衷是用于监控 Cassandra 中 ssTables 的占用情况。

本工具 es-pcstat 基于 pcstat 进行二次开发，以 ES 索引为维度，细化到 lucene 文件的粒度来对 page cache 占用情况进行采集，可对cfs、fdt、doc、pos、tim、dvd等重要文件进行细粒度的采集和监控。支持数据输出到控制台、日志、ES，配套kibana仪表盘支持查看各索引、各类文件的时序变化曲线。

源码地址

https://github.com/zhangdapao995/es-pcstat

功能点

采集目标：ES索引下各类 lucene 文件的 page cache 占用，单位MB，默认采集全部索引，支持配置采集的索引前缀。

运行环境

系统环境：类unix、linux环境
ES 版本：6.x、7.x

功能项

数据输出：控制台、日志和ES
- 控制台：查看各索引 cache，支持排序
- 日志和ES：采集维度从上到下依次为节点->索引->主副分片->文件后缀
可视化：数据输出为 ES 时，支持 kibana 仪表盘配置
- 支持按节点、索引、主副分片类型筛选查看
- 支持查看索引 page cache top10 波动曲线

获取可执行文件

linux_x64

linux 64位可通过如下命令获取可执行文件

curl -L -o es-pcstat https://gitee.com/verdant/es-pcstat/attach_files/835465/download/es-pcstat-linux-x64
chmod 755 es-pcstat

mac

mac 64位可通过如下命令获取可执行文件

curl -L -o es-pcstat https://gitee.com/verdant/es-pcstat/attach_files/835463/download/es-pcstat-darwin-x64
chmod 755 es-pcstat

运行

执行命令

./es-pcstat [parameters] <config_file>

例：./es-pcstat -collectIntervalFlag=30 -sortFlag=true ./es.conf

运行可选参数

  -collectIntervalFlag int
        采集间隔 (default 60)
  -outputTypeFlag string
        数据输出方式 [es, log, console] (default "console")
  -sortFlag
        仅对console类型生效，结果按page cache大小排序

配置文件

配置文件需填写es ip、端口、节点名、集群名和数据目录，其中path需要填写indices目录，一般为es的 data.path配置后增加"/nodes/0/indices"。

名称	描述	默认值
es.ip	采集的es节点ip
es.port	采集的es节点端口
es.indicesPath	采集的es节点indices目录，一般为"${data.path}/nodes/0/indices"
es.nodeName	采集的es节点名
es.clusterName	采集的es集群名
es.collection.indicesPrefix	需采集的索引名前缀，不填则采集全部；样例：pcstat
output.log.keepLogNum	针对日志形式输出生效，保留日志文件个数（按天拆分）	5
output.log.logPath	针对日志形式输出生效，日志全路径	/tmp/pcstat.log
output.es.keepIndexNum	针对es输出生效，保留索引个数（按天拆分）	5
output.es.pcIndexName	针对es输出生效，索引名（如需使用kibana仪表盘配置请勿修改）	pc_stat

#es conf
es.ip=127.0.0.1
es.port=9200
es.indicesPath=/xxx/xxx/elasticsearch-6.7.1/data/nodes/0/indices
es.nodeName=node1
es.clusterName=es_local

#采集索引前缀,设置为空则采集全部
es.collection.indicesPrefix=

#该配置仅日志输出生效 output log,保留个数单位为天
output.log.keepLogNum=5
output.log.logPath=/tmp/pcstat.log

#该配置仅es输出生效 output es,保留个数单位为天
output.es.keepIndexNum=5
output.es.pcIndexName=pc_stat

输出模式

控制台输出

执行命令

./es-pcstat -collectIntervalFlag=30 -sortFlag=true ./es.conf

结果示例


| index_name                            | cache (MB) | pri cache  | rep cache  |
+---------------------------------------+------------+------------+------------+
| fusion-media.task.task                |  247       |  247       |  0         |
| total                                 |  247       |  247       |  0         |
+---------------------------------------+------------+------------+------------+

日志输出

执行命令

./es-pcstat -outputTypeFlag=log ./es.conf

对应日志文件得到的内容，日志可进一步通过日志服务采集分析（如阿里云sls等）

{"cache":{"cfs":0,"dim":0,"doc":0,"dvd":0,"fdt":0,"nvd":0,"other":0,"pos":0,"tim":0,"total":0},"cluster_name":"es_local","fields.time":"2021-05-06T15:16:30.525475+08:00","index_name":"total","level":"info","msg":"","node_name":"node1","primary":false,"time":"2021-05-06T15:16:30"}

ES 输出

执行命令

./es-pcstat -outputTypeFlag=es ./es.conf

运行后会将采集到的数据回写到被监控的 ES 集群可导入kibana仪表盘配置文件es-pcstat-kibana.json，通过图表进行page cache分析。

导入方式

图1 kibana导入仪表盘配置

导入后打开dashboards菜单栏，page_cache仪表盘

图2 kibana仪表盘入口

细节可查看如下图表 1）cache占用top10的索引波动图

图3 kibana仪表盘-cache top10

2）cache详细信息，可筛选节点、索引、主副分片，不选择展示合计数据。

图4 kibana仪表盘-cache占用详情

备注

如需使用上述kibana仪表盘导入文件，请勿修改conf文件中的output.es.pcIndexName以及运行命令的collectIntervalFlag，修改output.es.pcIndexName会导致仪表盘读不到数据，修改collectIntervalFlag会导致仪表盘聚合数据异常；
kibana7.5后Date Histogram的interval有所调整，会导致时间拉长后interval成倍增大，统计值不准，建议选取时间范围在4-6小时内，https://elasticsearch.cn/question/11062
使用案例

通过 es-pcstat 采集得到的 page cache 时序图，可为性能监控、资源分析、异常请求定位等问题提供一定帮助，以下将从笔者团队使用中的几个案例进行展开。

一个简单示例：每条横线代表一个索引的所有 lucene 文件资源占用，一小时内的采样可以发现两个转折点

1 触发了副本清0操作，由于该集群副本不涉及搜索，所占用的内存比例较少
2 触发了一些查询请求，部分索引所占资源上涨

图5 索引资源波动-基于阿里云sls仪表盘

案例一：资源分析

通过观察一段时间的资源波动可评估预留给 lucene 的 page cache 是否充裕，如下两张图展示了两个集群中单个节点一天的资源占用情况，图6资源较为充裕，整体趋势几乎无大的波动，图7资源较为紧张，频繁出现 page cache 的换入换出。

图6 索引内存资源评估-充足

图7 索引内存资源评估-不足

案例二：merge的影响

如图8所示，通过监控可以发现某个索引的 page cache 上涨非常明显，导致其他索引的资源被换出，这种抢占会导致搜索服务波动；通过kibana排查该时间段内该索引的监控，发现段的数量有所下降，查看段文件后发现在该时间段后生成了几个较大的段文件，判定是 merge 导致 page cache 上涨，通过图9可以看到 merge 过程中 fdt 文件的上涨尤其明显（主要因为 merge 需要 load 原始内容进行处理），merge 完成后 fdt 的 cache 会慢慢的换出。

由于采用了存储计算分离的架构，后续可考虑将数据规模达到一定阈值的 merge 操作移到专属的 merge 节点处理，以此减少 merge 引起的 cache 换入换出对搜索服务节点带来的波动。

图8 整体资源波动，某个索引资源迅速上涨

图9 引起问题的索引波动，fdt上涨尤为明显

案例三：异常查询请求定位

有时集群的整体响应突然变慢，却不知道是由哪个索引、或哪个查询引起的？

例如某天一个 ES 集群突然出现大量超时请求，查看节点监控，ygc有所下降，cpu利用率一直在高位；再查看磁盘监控，发现磁盘读吞吐处于高负荷状态。

图10 异常请求引起的磁盘IO满负荷

通过这些常规的监控无法进一步定位到异常原因，再来看看 page cache 的监控。根据“索引cache top N”图表可以明显发现异常时间点有个索引的cache大幅度上涨，其他索引的 cache 都有所下降，在异常时间段内，曲线的毛刺极为明显，由此可以判断是堆外内存不够，导致各索引的 page cache 出现争用，进而需要从磁盘上获取数据。

图11 索引内存资源占用波动-top10

再进一步查看 cache 上涨期间问题索引各类文件的 cache 情况，可看到 doc和pos 有明显上涨，doc文件存储倒排表及词频，由包含每个 term 以及频率的 docs 列表组成，pos 存储出现在索引中 term 的位置信息。二者在 phrase 查询中会被联合使用。当一个平时使用率不高的索引突然出现了大量的 phrase 查询，内存资源比较吃紧（该节点预留给堆外的只有7 GB），进而就产生了上述问题。

图12 索引内存资源占用波动-异常索引详情

对于某些突发的，却给集群造成较大压力的请求，可以尝试通过 page cache 监控去排查定位。

当然要把具体的 lucene 文件类型变化趋势和查询关联起来，需要对各类查询涉及的文件有一定了解，相关细节可查看“基础知识->lucene 文件类型”一节，典型的如

dvd 上涨可以猜测是有聚合、脚本、排序的请求
doc、pos上涨可以联想到是否有 phrase 查询请求
fdt 上涨可能涉及大量的源数据拉取或 merge 操作

案例四：为性能优化制定方向

随着系统的发展、数据量的增长，在某个业务场景 ES 相关的资源和效率可能逐渐成为瓶颈，这时候我们就需要从底层视角来推动上层的优化，如图13所示，根据监控曲线可发现 fdt、doc、pos 几类文件的常驻内存资源较多，便可从这3类文件的使用情况出发来制定优化方向：

fdt 常用于获取_source字段的内容，如果存储并在查询结果中获取大量字段很容易导致该文件频繁访问，进而占用较多资源，可以考虑对 _source 进行适当删减，或将数据获取逻辑移至宽表数据库，如HBase等，让 ES 的资源更多的用于搜索本身；
doc 在 term 和全文搜索场景均有使用，这类文件的加载通常不可避免，可以从降低文件大小来入手，如在分词层面进行优化，对词的分布进行统计分析，来评估是否可以补充停用词等；
pos 用于需要位置信息的 phrase 查询，可从查询语句的拼装进行优化。

图13 观察内存资源占用来制定优化方向

总结及未来展望

es-pcstat 从 ES 索引和 lucene 各类文件 page cache 占用的角度，提供了一种对 ES 进行监控的全新思路，基于这些监控数据我们可以进行资源的饱和度评估，异常查询请求的定位，或者为性能优化制定方向。

当然异常请求的定位都只能限于事后分析，无法避免问题的产生，如何通过监控数据和查询请求去评估一个 query 可能对集群产生的影响，并拦截可能导致较大 page cache 争用的请求，这将能为集群的稳定性提供更大的保障。

es-pcstat 采集细化到了 lucene 文件的粒度，需要具备一定基础知识和经验才能快速定位背后原因，因此在分析上具备一定门槛，如果能根据文件波动来为监控者提供一些 ES 层面的提示，将能服务更广大的 ES 用户。

在 ES 中对一个查询的成本（涉及JVM中的缓存、系统内存缺页中断、IO、CPU等）进行评估本身是一件比较难的事，page cache 的监控可能能提供一定的帮助，当然还有更多的作用等待我们去探索。

参考链接

https://github.com/tobert/pcstat
https://www.amazingkoala.com.cn/Lucene/2019/1205/115.html
https://www.elastic.co/guide/en/elasticsearch/reference/master/index-modules-store.html

收起阅读 »

社区日报第1266期 (2021-11-30）

1. ES 的一些调优思考和实践参考（需要科学上网）
https://medium.com/explorium-a ... 02ac2
2. Tinder ES 性能提升的一些最佳实践（1）（需要科学上网）
https://medium.com/tinder-engi ... e5224
3. Tinder ES 性能提升的一些最佳实践（2）（需要科学上网）
https://medium.com/tinder-engi ... ee85b
编辑：斯蒂文
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1265期 (2021-11-29）

1. Elasticsearch中文文档（7.3版本）
https://learnku.com/docs/elasticsearch73/7.3

2. Elasticsearch在360企业安全集团的应用实践
https://www.ximalaya.com/keji/14965410/155209795

3. 使用 Elasticsearch 时间点读取器获得随时间推移而保持一致的数据视图
https://www.elastic.co/cn/blog ... eader

编辑：xiaowei
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1264期 (2021-11-28）

1. 一键快速查询 Elastc Stack 组建各组件兼容性
https://www.elastic.co/cn/support/matrix

2.Elastic Stach 各大版本演进
https://www.modb.pro/db/130339

3.阿里云es针对低成本所做的优化
https://developer.aliyun.com/article/744496

编辑：cyberdak
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1263期 (2021-11-27）

1.es不同集群、不同版本间数据迁移工具

[https://github.com/medcl/esm](https://github.com/medcl/esm)

2.优化es排序以加快查询速度的手段

[https://www.elastic.co/cn/blog ... sults](https://www.elastic.co/cn/blog ... esults)

3.一周热点：长津湖票房超过战狼2

[https://www.sohu.com/a/503305376_128476](https://www.sohu.com/a/503305376_128476)

* 编辑：bsll

* 归档：https://ela.st/cn-daily-all

* 订阅：https://ela.st/cn-daily-sub

* 沙龙：https://ela.st/cn-meetup

继续阅读 »

Elastic 中国开发者大会 2021 演讲报名开放申请中

Elastic 中国开发者大会 2021 是由 Elastic 官方、Elastic 中文社区和极限科技联合主办的开发者大会，作为中国国内唯一一个专门讨论 Elasticsearch 开源技术的大会，是中国最权威和最具实力干货的技术大会，其专业性和内容的质量一直以来在业内都是有口皆碑，大会最早发起于 2013 年初一个很小的线下聚会，之后每年迅速成长，往年大会的演讲嘉宾有来自 Elastic 官方、百度、腾讯、阿里巴巴、360、微博、美团、58、苏宁等众多公司的技术专家，带来过众多精彩的分享，与会听众大多为大数据领域相关的架构师、技术经理与一线开发工程师和运维工程师。

我们本着非盈利目的来举办大会，今年的大会将于2022年1月8号在深圳举行，举办开发者大会的目的是为中国广大的 Elasticsearch 开发者提供一个技术交流和学习切磋的地方，汇集业界众多的成功案例，集思广益，发散思维，促进社区和行业的进步。

大会官网：

https://conf.elasticsearch.cn

Elasticsearch铁粉福利：

预热-铁粉票(79元/张)，共计100张，数量有限，赶紧去报名抢购吧！

购票地址：

https://www.bagevent.com/event/7899116

同时大会也在公开征集演讲议题与合作赞助商，欢迎各位Elastic相关技术大咖报名参与分享，欢迎有兴趣的赞助商金主大大前来合作。

演讲报名申请：

http://elasticsearch.mikecrm.com/uXH61JL

赞助合作申请：

http://elasticsearch.mikecrm.com/6LGkKK0

演讲议题形式

主题演讲时长

20，30或45分钟，包括提问环节

演讲内容标准

观点：申请人演讲的观点是否明确，所阐述的内容是否吸引人，是否有助于听众在知识和经验方面的积累？实践：演讲内容，均以实践为出发。深度：演讲内容的深度将直接关系到听众的收获，听众能够从演讲中挖掘出的内容也是组委会看重的，原则上，有深度的演讲稿被采纳的机会更高。专业声誉：演讲人在所提交演讲涉及的专业领域的成就和从业经验也会作为评审的参考标准。不要广告：讲台不是厂商宣传的舞台，请不要试图在演讲时做任何形式的广告。听众所得：听众在演讲分享中可能的收获是组委会最关注的，这也是大会举办的重要意义。

注意事项

在大会议程尚未完全确定之前，可自由提交演讲议题若内容合适，但相应专题已无空档，可优先在下届大会/Meetup获得演讲机会请确保您所提供的个人信息内容准确无误，一旦确认，信息将会刊登在大会官网并印制在会刊中请确保您在演讲内容中使用的案例已经获得第三方的认可和允许，我们将不负责由此引起的任何纠纷和问题确认的演讲内容将发布在主办单位的有关媒介中，包括会议演讲 PPT、现场视频等。此非强制条款，如果不同意，请提前声明对于已提交演讲议题的审批结果，我们将在大会开始前一个月通过电子邮件或电话联系的方式通知您

主题范围供参考：

Elastic Stack 技术实践
Elastic Stack 技术解读
Elastic Stack 扩展开发
日志领域的实践与案例
安全领域的实践与案例
搜索领域的实践与案例
APM 领域的实践与案例
指标分析的实践与案例
BI 商业应用分析案例
Elastic 在传统行业的应用
架构变迁与平台化实践
性能调优与分布式
NLP 与自然语言处理
数据接入与 ETL 数据处理
大数据分析与实时性
数据可视化分析与展现
人工智能、机器学习与 AI 应用
自动化运维、DevOps、AIOps
开源与社区建设
任何与 Elasticsearch 有关的酷话题

另外，欢迎提交闪电演讲，每人5分钟，严格掐秒，紧张刺激，一共有10个空位，分享主题不限。

主题递交截止时间：2021年12月10日

还等什么，赶紧提交报名吧。社区有你更精彩！

继续阅读 »

Elastic 中国开发者大会 2021 是由 Elastic 官方、Elastic 中文社区和极限科技联合主办的开发者大会，作为中国国内唯一一个专门讨论 Elasticsearch 开源技术的大会，是中国最权威和最具实力干货的技术大会，其专业性和内容的质量一直以来在业内都是有口皆碑，大会最早发起于 2013 年初一个很小的线下聚会，之后每年迅速成长，往年大会的演讲嘉宾有来自 Elastic 官方、百度、腾讯、阿里巴巴、360、微博、美团、58、苏宁等众多公司的技术专家，带来过众多精彩的分享，与会听众大多为大数据领域相关的架构师、技术经理与一线开发工程师和运维工程师。

我们本着非盈利目的来举办大会，今年的大会将于2022年1月8号在深圳举行，举办开发者大会的目的是为中国广大的 Elasticsearch 开发者提供一个技术交流和学习切磋的地方，汇集业界众多的成功案例，集思广益，发散思维，促进社区和行业的进步。

大会官网：

https://conf.elasticsearch.cn

Elasticsearch铁粉福利：

预热-铁粉票(79元/张)，共计100张，数量有限，赶紧去报名抢购吧！

购票地址：

https://www.bagevent.com/event/7899116

同时大会也在公开征集演讲议题与合作赞助商，欢迎各位Elastic相关技术大咖报名参与分享，欢迎有兴趣的赞助商金主大大前来合作。

演讲报名申请：

http://elasticsearch.mikecrm.com/uXH61JL

赞助合作申请：

http://elasticsearch.mikecrm.com/6LGkKK0

演讲议题形式

主题演讲时长

20，30或45分钟，包括提问环节

演讲内容标准

观点：申请人演讲的观点是否明确，所阐述的内容是否吸引人，是否有助于听众在知识和经验方面的积累？实践：演讲内容，均以实践为出发。深度：演讲内容的深度将直接关系到听众的收获，听众能够从演讲中挖掘出的内容也是组委会看重的，原则上，有深度的演讲稿被采纳的机会更高。专业声誉：演讲人在所提交演讲涉及的专业领域的成就和从业经验也会作为评审的参考标准。不要广告：讲台不是厂商宣传的舞台，请不要试图在演讲时做任何形式的广告。听众所得：听众在演讲分享中可能的收获是组委会最关注的，这也是大会举办的重要意义。

注意事项

在大会议程尚未完全确定之前，可自由提交演讲议题若内容合适，但相应专题已无空档，可优先在下届大会/Meetup获得演讲机会请确保您所提供的个人信息内容准确无误，一旦确认，信息将会刊登在大会官网并印制在会刊中请确保您在演讲内容中使用的案例已经获得第三方的认可和允许，我们将不负责由此引起的任何纠纷和问题确认的演讲内容将发布在主办单位的有关媒介中，包括会议演讲 PPT、现场视频等。此非强制条款，如果不同意，请提前声明对于已提交演讲议题的审批结果，我们将在大会开始前一个月通过电子邮件或电话联系的方式通知您

主题范围供参考：

Elastic Stack 技术实践
Elastic Stack 技术解读
Elastic Stack 扩展开发
日志领域的实践与案例
安全领域的实践与案例
搜索领域的实践与案例
APM 领域的实践与案例
指标分析的实践与案例
BI 商业应用分析案例
Elastic 在传统行业的应用
架构变迁与平台化实践
性能调优与分布式
NLP 与自然语言处理
数据接入与 ETL 数据处理
大数据分析与实时性
数据可视化分析与展现
人工智能、机器学习与 AI 应用
自动化运维、DevOps、AIOps
开源与社区建设
任何与 Elasticsearch 有关的酷话题

另外，欢迎提交闪电演讲，每人5分钟，严格掐秒，紧张刺激，一共有10个空位，分享主题不限。

主题递交截止时间：2021年12月10日

还等什么，赶紧提交报名吧。社区有你更精彩！

收起阅读 »

社区日报第1262期 (2021-11-26）

1、使用explain API摆脱ElasticSearch集群RED苦恼
https://segmentfault.com/a/1190000008956708
2、讨论：Elasticsearch 在未来会全面替代传统的关系型数据库吗？
https://www.v2ex.com/t/816686#reply36
3、使用 Elasticsearch、Kubeflow 和 Katib 构建完整的基于 AI 的搜索引擎
https://towardsdatascience.com ... 7eb8f

编辑：铭毅天下
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1261期 (2021-11-25）

1.Running A Serverless Lucene Reverse Geocoder
https://spinscale.de/posts/202 ... .html

2.极限数据平台-一个 Elasticsearch 多集群监控和管理平台
https://www.bilibili.com/video/BV1cq4y1g71p

3.使用 Elasticsearch Health Check-Up 检查集群设置
https://opster.com/blogs/elast ... ysis/

编辑：Se7en
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1260期 (2021-11-24)

1.ElasticSearch Merge机制和写放大问题研究
https://bbs.huaweicloud.com/blogs/detail/197771
2. Understanding Elasticsearch Persistent Tasks
https://spinscale.de/posts/202 ... .html
3. 分布式日志系统Graylog、Loki及ELK的分析和对比
https://mp.weixin.qq.com/s/YRzbP8LM2q1w81ZwQb0U7A

编辑：kin122
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1259期 (2021-11-23）

1. 排查Elasticsearch本机内存泄漏
https://javakk.com/1164.html

2. 国外某大佬设计的一套ES练习题
https://georgebridgeman.com/ex ... s-01/

3. rebalance功能及源码解析
https://www.jianshu.com/p/fdf41a58900f

编辑：斯蒂文
归档：[https://ela.st/cn-daily-all](https://ela.st/cn-daily-all)
订阅：[https://ela.st/cn-daily-sub](https://ela.st/cn-daily-sub)
沙龙：[https://ela.st/cn-meetup](https://ela.st/cn-meetup)

继续阅读 »

社区日报第1258期 (2021-11-22）

1. Beats：使用 Filebeat 中的 HTTP JSON input 来摄入网络服务数据
https://elasticstack.blog.csdn ... 33075

2. Kibana：如何在 Maps 应用中显示图片提示
https://elasticstack.blog.csdn ... 03439

3. elasticsearch-script-painless-使用说明与实践
https://www.cnblogs.com/zxbdboke/p/14540526.html
https://www.cnblogs.com/zxbdboke/p/14540689.html

编辑：Word缘
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

前言

基础知识

Elasticsearch 内存相关

lucene 文件类型

lucene 文件读取方式

工具使用说明

源码地址

功能点

获取可执行文件

linux_x64

mac

运行

配置文件

输出模式

控制台输出

日志输出

ES 输出

使用案例

案例一：资源分析

案例二：merge的影响

案例三：异常查询请求定位

案例四：为性能优化制定方向

总结及未来展望

参考链接

前言

基础知识

Elasticsearch 内存相关

lucene 文件类型

lucene 文件读取方式

工具使用说明

源码地址

功能点

获取可执行文件

linux_x64

mac

运行

配置文件

输出模式

控制台输出

日志输出

ES 输出

使用案例

案例一：资源分析

案例二：merge的影响

案例三：异常查询请求定位

案例四：为性能优化制定方向

总结及未来展望

参考链接

大会官网：

Elasticsearch铁粉福利：

购票地址：

演讲报名申请：

赞助合作申请：

演讲议题形式

演讲内容标准

注意事项

推荐机制

主题范围供参考：

主题递交截止时间：2021年12月10日

大会官网：

Elasticsearch铁粉福利：

购票地址：

演讲报名申请：

赞助合作申请：

演讲议题形式

演讲内容标准

注意事项

推荐机制

主题范围供参考：

主题递交截止时间：2021年12月10日

活动推荐

热门文章

热门话题