packetbeat抓取redis命令，丢包率较大

Beats • wjj_ah 发起了问题 • 1 人关注 • 0 个回复 • 2729 次浏览 • 2019-11-14 09:31 • 来自相关话题

Beats：如何创建一个定制的Elastic beat

Beats • liuxg 发起了问题 • 1 人关注 • 0 个回复 • 3201 次浏览 • 2019-11-13 22:38 • 来自相关话题

ES脚本性能优化一例

Elasticsearch • hufuman 发表了文章 • 0 个评论 • 5431 次浏览 • 2019-11-13 19:48 • 来自相关话题

使用painless脚本为文档自定义打分是很常见的场景，对新人来说也是最容易造成性能问题的地方。本文中使用两个例子简单谈一下脚本性能优化。

目标

ES本身是基于倒排等数据结构实现的查询，因此在做类似Term、Match等可以利用底层数据结构的场景进行查询时，性能是很好的。

脚本和term等查询不一样，无法利用现有的各种数据结构，可以简单理解成循环：

 docs = getDocs(xxx); // 获取满足条件的文档列表 for(Doc doc : docs) { score = getScoreByScript(doc); } 

因此脚本的性能取决于两个地方：脚本的复杂度和满足条件的文档数。

例子1

我们有个场景是查询指定坐标指定范围内的POI列表，例如5公里内的景点列表。

由于我们的距离公式和ES默认的都不一致，如下：

/**

计算距离，返回单位：米
/
public static Double getDistance(Double lat1, Double lng1, Double lat2, Double lng2) {
double diffLon = Math.abs(lng1 - lng2);
if (diffLon > 180)
diffLon -= 360;
return Math.sqrt(Math.pow(diffLon, 2) + Math.pow(lat1 - lat2, 2)) 110.0 * 1000;
}

所以该同学把这段Java代码转成了Painless，在sort里使用这个该方法计算出距离。上线以后发现ES有了很多慢查询，对应的服务也95线、99线也比较高。

原因是其他脚本没有有效地缩小数据量，导致有几百万的数据需要使用该脚本做距离计算，给ES的CPU造成很大压力，查询性能也比较差。

该例子优化起来很简单，即使用ES自带的distance做较大范围的限制，例如需要5公里的数据，可以用ES的plain距离做限制，再加上之前的自定义脚本逻辑。由于ES的plain距离计算性能好很多，因此经过该过滤以后，自定义脚本的文档量少了很多，因此整体性能有了很大提升。

例子2

有个场景是对文章进行搜索，如果文章关联的城市是指定的几个城市，则给额外的加分。例如：

 { "query": {xxx}, "sort": [ { "_script": { "script": { "source": "def score = 0;def cityIds = doc['cityIds']; def paramCityIds = params.cityIds; for (int i=0; i<cityIds.size(); i++){if (paramCityIds.contains(cityIds[i])){score += 100;}} return score;", "lang": "painless", "params": { "cityIds": [2,1,3] } }, "type": "number", "order": "desc" } } ] } 

问题和例子1一样，该功能的性能比较差。虽然脚本简单，但是满足的文档量比较大，带来的计算量也比较多，因此性能上不去。

这是一个比较常见的场景，问题的根源还是对ES的机制不够了解，优化起来也很简单，想办法利用到倒排就可以了。

ES里有个专门针对改场景的查询：[constant_score](https://www.elastic.co/guide/e ... y.html)，因此以上查询可以修改为：

 { "query": { "should": [ { "constant_score": { "filter": { "term": { "cityIds": 2 } }, "boost": 5 } }, { "constant_score": { "filter": { "term": { "cityIds": 1 } }, "boost": 5 } }, { "constant_score": { "filter": { "term": { "cityIds": 3 } }, "boost": 5 } } ] }, "sort": [ { "_score": "desc" ] } 

性能即可得到极大改善。

分片大小由什么控制？

贡献

Elasticsearch • tacsklet 回复了问题 • 3 人关注 • 1 个回复 • 772 次浏览 • 2019-11-13 18:57 • 来自相关话题

使用字符替换（char_filter）的时候怎么指定替换空格？

Elasticsearch • XZ 回复了问题 • 1 人关注 • 1 个回复 • 2207 次浏览 • 2019-11-13 17:45 • 来自相关话题

社区日报第781期 (2019-11-13)

社区日报 • 千夜发表了文章 • 0 个评论 • 1026 次浏览 • 2019-11-13 17:24 • 来自相关话题

原创 Elasticsearch：Cluster备份 Snapshot及Restore API

贡献

Elasticsearch • zqc0512 回复了问题 • 2 人关注 • 1 个回复 • 1147 次浏览 • 2019-11-13 15:10 • 来自相关话题

filebeat 抓日志将服务器cpu打满

贡献

Beats • zqc0512 回复了问题 • 2 人关注 • 2 个回复 • 2009 次浏览 • 2019-11-13 15:09 • 来自相关话题

logstash无法消费kafka数据

贡献

Logstash • medcl 回复了问题 • 4 人关注 • 3 个回复 • 6559 次浏览 • 2019-11-13 14:35 • 来自相关话题

ES里面3张表有相同的数据,如何一次拿出呢求解求解求解

贡献

Elasticsearch • zongruibiao 回复了问题 • 2 人关注 • 2 个回复 • 1457 次浏览 • 2019-11-13 14:14 • 来自相关话题

求助java 查600条数据为什么要3秒左右

Elasticsearch • 2534398799_ 发起了问题 • 1 人关注 • 0 个回复 • 1150 次浏览 • 2019-11-13 12:37 • 来自相关话题

elasticsearch启动报错

Elasticsearch • wuzhihu 回复了问题 • 2 人关注 • 1 个回复 • 1804 次浏览 • 2019-11-13 11:41 • 来自相关话题

es 批量查询msearch异常

贡献

Elasticsearch • yqbboy 回复了问题 • 2 人关注 • 2 个回复 • 6173 次浏览 • 2019-11-13 10:55 • 来自相关话题

【深圳ES Meetup】字节跳动黄杨锋：从0到1构建 ES 服务平台的挑战

活动 • nodexy 发表了文章 • 0 个评论 • 3584 次浏览 • 2019-11-13 09:07 • 来自相关话题

11月16日 Elastic 中文社区深圳 Meetup 上，黄杨锋将为大家分享基于K8S的ES服务平台在头条的实践。借此机会，我们邀请到他聊聊从0到1构建ES服务平台遇到的痛点、解决方案以及未来的规划。

分享嘉宾 黄杨锋 高级工程师 @字节跳动

目前在头条深圳负责ES服务平台相关的研发工作；此前曾就职于华为、YY、腾讯等企业，在腾讯基于ES做微信支付数据的检索。

Q1、从0到1构建 ES 服务平台的过程中有哪些痛点？分别是如何解决的？

A：（1）需要隔离，远离大集群，是通过 k8s来解决。

（2）性能分析方面相对还比较薄弱，打算增加metric和trace日志来看看具体耗时。

Q2、在 ES 服务平台方面未来还有什么样的规划？

A：相关规划详见下图

Q3、结合您的实践经历，对 ES 目前的生态发展、应用以及未来有什么样的看法？

A： ES 发展很快，周边生态也越来越丰富，希望 ES 在快速发展的过程中，更加注重查询性能的优化提升，以及集群的稳定性。

Q4、您对本次技术沙龙活动的主题分享有什么期待？

A：期望看到性能优化、机器学习相关的最新进展。

Q5、您对 Elastic 中文社区发展有什么意见或建议呢？

A：（1）ES 在中国程序员中的影响力感觉可以加强，希望可以做到像 Google/Amazon 在中国程序员群体上那样有很大的影响力；

（2）希望官方出一些内核相关的书籍或文章；

（3）希望价钱可以再调低点。

11月16日 Elastic 中文社区深圳 Meetup 火热报名中

主题分享：《基于K8S的ES服务平台在头条的实践介绍》黄杨锋

主题摘要：ES 服务平台自上线以来，已经接入了头条、抖音等众多业务。本次分享将介绍 ES 服务平台从 0 到 1 的创建过程中所做的一些工作，包括 K8S 碰到的一些难点、ES 功能的增强、跨机房容灾、全栈监控告警、自动化部署等功能。

给text字段添加了个 keyword，那么旧数据怎么给keyword初始化，环境是es5.5

贡献

Elasticsearch • mobikarl 回复了问题 • 2 人关注 • 1 个回复 • 1765 次浏览 • 2019-11-13 08:35 • 来自相关话题

通知设置新通知

发现