elastic

你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

es可以和其他数据库组合使用吗？

贡献

Elasticsearch • God_lockin 回复了问题 • 3 人关注 • 1 个回复 • 4509 次浏览 • 2023-07-03 10:32 • 来自相关话题

社区日报第1651期 (2023-06-21）

社区日报 • kin122 发表了文章 • 0 个评论 • 3633 次浏览 • 2023-06-21 10:22 • 来自相关话题

1.Elasticsearch：实用 BM25 - 第 1 部分：分片如何影响 Elasticsearch 中的相关性评分 https://blog.csdn.net/UbuntuTo ... 26968 2.Elasticsearch：实用 BM25 - 第 2 部分：BM25 算法及其变量 https://blog.csdn.net/UbuntuTo ... 39480 3.Elasticsearch：实用 BM25 - 第 3 部分：在 Elasticsearch 中选择 b 和 k1 的注意事项 https://blog.csdn.net/UbuntuTo ... 68368 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup B站：https://ela.st/bilibili

Elastic 中国开发者大会 2023 志愿者招募中

活动 • liaosy 发表了文章 • 0 个评论 • 5053 次浏览 • 2023-03-17 19:12 • 来自相关话题

会议简介

Elastic 中国开发者大会 2023 是由 Elastic 官方、Elastic 中文社区和极限科技联合主办的开发者大会，作为中国国内唯一一个专门讨论 Elasticsearch 开源技术的大会，是中国最权威和最具实力干货的技术大会，其专业性和内容的质量一直以来在业内都是有口皆碑，大会最早发起于 2013 年初一个很小的线下聚会，之后每年迅速成长，往年大会的演讲嘉宾有来自 Elastic 官方、百度、腾讯、阿里巴巴、360、微博、美团、58、苏宁等众多公司的技术专家，带来过众多精彩的分享，与会听众大多为大数据领域相关的架构师、技术经理与一线开发工程师和运维工程师。

我们本着非盈利目的来举办大会，今年的大会将于2023年4月8日在深圳举行，举办开发者大会的目的是为中国广大的 Elasticsearch 开发者提供一个技术交流和学习切磋的地方，汇集业界众多的成功案例，集思广益，发散思维，促进社区和行业的进步。

更多会议介绍请访问官网。

志愿者招募

要办好一场大会需要各种各样的工作，尤其是我们这种社区类型的活动，更是离不开社区成员的大力支持，感谢所有往届参与 Elastic 开发者大会的志愿者们，因为有你们，大会才精彩！

如果您愿意为本次大会贡献力量，我们将非常欢迎您。

报名条件

4月8日全天，部分岗位要求全程参与；
自愿参加志愿服务热心公益事业、有爱心、有活力、积极向上；
具有良好的组织协调、语言表达和人际沟通能力；
具备志愿服务岗位所必需的专业知识和技能；
普通话规范，部分岗位要求具备英语的对话交流能力；
参加过大型会议、活动或其他具有志愿服务经历的申请人优先；
具备志愿者服务岗位的服务精神，严于律己，服从大会组委会的工作安排。

志愿者权益

门票免费
早餐，午餐，晚餐，零食
参会者礼品
工作 T 恤
可提供社会实践证明
近距离接触和认识业界大牛并有机会交流和探讨技术问题

名额有限，组委会统一组织初审及面试工作。

志愿者报名地址

http://elasticsearch.mikecrm.com/ObJH8pp

扫码立即报名

部分往期大会志愿者风采

约吗？3月16日，Elastic与阿里云中国用户峰会在京开启

活动 • liaosy 发表了文章 • 0 个评论 • 4772 次浏览 • 2023-03-07 20:53 • 来自相关话题

在搜索的道路上，Elastic一直与您同在。 Elastic携手阿里云深耕中国，持续为中国用户提供本土化的搜索解决方案。本次峰会，Elastic大中华区及东南亚区域副总裁 Rain Hu女士将为您带来Elastic对搜索的最新洞察与见解。诚邀您与会，让我们一起用搜索，找寻商业未来。

【重启通知】Elastic 中国开发者大会定于2023年4月8日，深圳好日子皇冠假日酒店，欢迎前来参会！

活动 • liaosy 发表了文章 • 0 个评论 • 7031 次浏览 • 2023-01-19 15:18 • 来自相关话题

社区日报第1416期 (2022-06-08)

社区日报 • kin122 发表了文章 • 0 个评论 • 2077 次浏览 • 2022-06-08 10:11 • 来自相关话题

1. Elasticsearch：如何部署 NLP：情绪分析示例 https://elasticstack.blog.csdn ... 44885 2. 几分钟把Twitter数据流化并可视化到 Elasticsearch（需要梯子） https://medium.com/%40sean1223 ... 09f3d 3. Elastic APM 和 OpenTelemetry 集成 https://cloud.tencent.com/deve ... 13362 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup B站：https://ela.st/bilibili

社区日报第1398期 (2022-05-18)

社区日报 • kin122 发表了文章 • 0 个评论 • 2264 次浏览 • 2022-05-18 12:35 • 来自相关话题

1. Elasticsearch ILM 索引生命周期管理常见坑及避坑指南 https://blog.csdn.net/laoyang3 ... 31708 2. Elasticsearch — 写入和搜索优化建议（需要梯子） https://db-universe.medium.com ... e5259 3. elasticsearch APM 优化（需要梯子） https://medium.com/squad-engin ... 8bed5 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup B站：https://ela.st/bilibili

社区日报第1384期 (2022-04-27)

社区日报 • kin122 发表了文章 • 0 个评论 • 2406 次浏览 • 2022-04-27 10:26 • 来自相关话题

1. ES的nested字段和对象字段（需要梯子） https://opster.com/guides/elas ... ield/ 2. Elasticsearch跨集群数据备份和迁移 https://blog.51cto.com/liqingbiao/2539669 3. 我的es优化之路（需要梯子） https://medium.com/starbugs/%2 ... 5673c 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup

社区日报第1362期 (2021-03-30)

社区日报 • kin122 发表了文章 • 0 个评论 • 2175 次浏览 • 2022-03-30 09:46 • 来自相关话题

1. Elastic Stack最佳实践：7.10.1与7.14.2的性能比较 https://cloud.tencent.com/deve ... 59814 2. Elasticsearch：如何提高查询性能 https://elasticstack.blog.csdn ... 13496 3. Elastic APM：在全量和采样中寻找平衡 https://cloud.tencent.com/deve ... 64413 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup

社区日报第1355期 (2021-03-23)

社区日报 • kin122 发表了文章 • 0 个评论 • 2027 次浏览 • 2022-03-23 16:43 • 来自相关话题

1. Elasticsearch 和 MongoDB 对比 https://elasticstack.blog.csdn ... 29149 2. Elasticsearch Query optimisation techniques for relevant search results — Part 1（需要梯子） https://medium.com/codex/elast ... 718c0 3. Elasticsearch 在各大互联网公司大量真实的应用案例！ https://zhuanlan.zhihu.com/p/138888359 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup

社区日报第1348期 (2021-03-16)

社区日报 • kin122 发表了文章 • 0 个评论 • 2219 次浏览 • 2022-03-16 18:24 • 来自相关话题

社区日报第1341期 (2021-03-09)

社区日报 • kin122 发表了文章 • 0 个评论 • 2286 次浏览 • 2022-03-09 10:19 • 来自相关话题

1. 【Elasticsearch源码】CCR源码分析（一） https://blog.csdn.net/wudingme ... 50044 2. 【Elasticsearch源码】CCR源码分析（二） https://blog.csdn.net/wudingme ... 64469 3. Elasticsearch In Action: Core Data Types（需要梯子） https://mkonda007.medium.com/e ... f6919 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup

社区日报第1334期 (2021-03-02)

社区日报 • kin122 发表了文章 • 0 个评论 • 2279 次浏览 • 2022-03-02 10:18 • 来自相关话题

1. 详解Elasticsearch的Global Ordinals与High Cardinality https://blog.csdn.net/zwgdft/a ... 15977 2. 在 Elasticsearch 中使用 PyTorch 进行现代自然语言处理的介绍 https://blog.csdn.net/UbuntuTo ... 09579 3. ES7的父子join查询（需要梯子） https://medium.com/swlh/parent ... a73fe 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup

社区日报第1327期 (2022-02-23）

社区日报 • kin122 发表了文章 • 0 个评论 • 2372 次浏览 • 2022-02-23 10:16 • 来自相关话题

1. 不当使用scroll导致elasticsearch内存暴涨的问题 https://bbs.huaweicloud.com/blogs/194928 2.如何在elasticsearch中轻松编写painless脚本 https://elasticstack.blog.csdn ... 26782 3.如何将ES与mysql同步（需要梯子） https://towardsdatascience.com ... 7b339 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup

社区日报第1320期 (2021-01-26)

社区日报 • kin122 发表了文章 • 0 个评论 • 2352 次浏览 • 2022-01-26 11:21 • 来自相关话题

1. Elasticsearch 关于 geo-point 和 geo-shape 查询（需要梯子） https://medium.com/geekculture ... 57527 2. 使用 Prometheus 和 grafana 监控ES（需要梯子） https://medium.com/rahasak/mon ... b6712 3. Elasticsearch：Dissect 和 Grok 处理器之间的区别 https://elasticstack.blog.csdn ... 26264 编辑：kin122 归档：https://ela.st/cn-daily-all 订阅：https://ela.st/cn-daily-sub 沙龙：https://ela.st/cn-meetup

rojay 回答了问题 • 2018-08-29 09:14 • 4 个回复不感兴趣

path.data 配置了多个路径后 es的存储和获取机制是什么

最近也遇到第一个问题。查找网上所有资料均未给出合适的答案，无奈只好硬着头皮去看源码。好在终于把这个原理理清楚了，来跟大家一起分享一下。

ES多盘shard分配原理
假设现在单机环境中有两块磁盘，es的配置文件elasticsearch.yml中的path.... 显示全部 »

最近也遇到第一个问题。查找网上所有资料均未给出合适的答案，无奈只好硬着头皮去看源码。好在终于把这个原理理清楚了，来跟大家一起分享一下。

ES多盘shard分配原理
假设现在单机环境中有两块磁盘，es的配置文件elasticsearch.yml中的path.data：/index/data,/data2/index/data
配置了两块盘，对应了两个路径。那么我现在要创建hrecord1索引的2个主shard分配原理如下：
首先会创建shard1（我估计ES会优先创建shard编号大的shard，但是影响不大），创建shard1的时候会找出两个路径对应的磁盘空间大的那个盘，然后将shard1放到那个路径下。
创建shard0的时候，会将/index和/data2磁盘的剩余可用空间相加，然后将这个总和乘以百分之五
将前面创建shard1的磁盘空间减去这个百分之五的值，然后再将这个差值与/data2磁盘剩余空间进行比较，找出磁盘空间大的，然后把shard0放到那个大的磁盘空间上。
说白了，这个百分之五的空间是ES为那个创建的shard1设置的预留空间吧。
有错误的地方也欢迎大家指出，一起交流哈！
主要代码在ShardPath.java里面
[code]public static ShardPath selectNewPathForShard(NodeEnvironment env, ShardId shardId, IndexSettings indexSettings,
long avgShardSizeInBytes, Map<Path,Integer> dataPathToShardCount) throws IOException {

final Path dataPath;
final Path statePath;

if (indexSettings.hasCustomDataPath()) {
dataPath = env.resolveCustomLocation(indexSettings, shardId);
statePath = env.nodePaths()[0].resolve(shardId);
} else {
BigInteger totFreeSpace = BigInteger.ZERO;
for (NodeEnvironment.NodePath nodePath : env.nodePaths()) {
totFreeSpace = totFreeSpace.add(BigInteger.valueOf(nodePath.fileStore.getUsableSpace()));
}

// TODO: this is a hack!! We should instead keep track of incoming (relocated) shards since we know
// how large they will be once they're done copying, instead of a silly guess for such cases:

// Very rough heuristic of how much dtisk space we expec the shard will use over its lifetime, the max of current average
// shard size across the cluster and 5% of the total available free space on this node:
BigInteger estShardSizeInBytes = BigInteger.valueOf(avgShardSizeInBytes).max(totFreeSpace.divide(BigInteger.valueOf(20)));

// TODO - do we need something more extensible? Yet, this does the job for now...
final NodeEnvironment.NodePath[] paths = env.nodePaths();
NodeEnvironment.NodePath bestPath = null;
BigInteger maxUsableBytes = BigInteger.valueOf(Long.MIN_VALUE);
for (NodeEnvironment.NodePath nodePath : paths) {
FileStore fileStore = nodePath.fileStore;

BigInteger usableBytes = BigInteger.valueOf(fileStore.getUsableSpace());
assert usableBytes.compareTo(BigInteger.ZERO) >= 0;

// Deduct estimated reserved bytes from usable space:
Integer count = dataPathToShardCount.get(nodePath.path);
if (count != null) {
usableBytes = usableBytes.subtract(estShardSizeInBytes.multiply(BigInteger.valueOf(count)));
}
if (bestPath == null || usableBytes.compareTo(maxUsableBytes) > 0) {
maxUsableBytes = usableBytes;
bestPath = nodePath;
}
}

statePath = bestPath.resolve(shardId);
dataPath = statePath;
}
return new ShardPath(indexSettings.hasCustomDataPath(), dataPath, statePath, shardId);
}[/code]

kennywu76 回答了问题 • 2017-04-12 11:36 • 4 个回复不感兴趣

如果目前索引已存在，如何增加分片数量？

分片没有办法在原索引上增加，可以创建一个设置了更多分片的空索引，然后利用reindex api重新索引一次。

白衬衣回答了问题 • 2017-09-06 14:58 • 7 个回复不感兴趣

elasticsearch打分优化

我猜测你想要的是降低词频评分的权重，可以在索引的mapping中禁用词频评分，"index_options": "docs"

kennywu76 回答了问题 • 2018-01-03 15:54 • 4 个回复不感兴趣

Elastic对类似枚举数据的搜索性能优化

这两天刚好和一个朋友在讨论这个问题，初步判断是因为5.0以后对于数值型字段采用了block k-d tree索引结构，导致status一类不同值不多，每个值对应的文档比较多的情况下，查询会比较缓慢。

改用keyword字段来索引就快了，深层次原因还在看... 显示全部 »

kennywu76 回答了问题 • 2018-05-25 15:15 • 3 个回复不感兴趣

ES节点都在，也是green状态，出现大量的pending_tasks，应该如何进行处理，有没有处理路程

先要看看这些pending_tasks是什么才好进一步分析。如果集群状态为green，没有数据shard在recovery，比较容易产生pending_tasks的是put_mappings这类操作。特别是如果用了动态mapping的情况下，比较容易因为... 显示全部 »

kennywu76 回答了问题 • 2018-06-08 11:33 • 6 个回复不感兴趣

ES集群如何进行挨个重启?

我来科普一下吧。

当cluster.routing.allocation.enable设置为"none"的时候，不会allocate任何UNASSIGNED状态的shard，但是有一个特例:

本地的因为重启而变成UNASSIGNED... 显示全部 »

我来科普一下吧。

当cluster.routing.allocation.enable设置为"none"的时候，不会allocate任何UNASSIGNED状态的shard，但是有一个特例:

本地的因为重启而变成UNASSIGNED状态的primary shard不受这个参数约束

怎么理解这个规则呢？举个例子吧。

假设集群索引都有设置复制片，然后重启了某一个结点，该结点上的shard会经历下面这个过程:

replica变成UNASSIGNED
primary在其他结点上对应的replica被推举为primary，而本地的这些primary变成replica，并且状态变成UNASSIGNED
由于cluster.routing.allocation.enable设置为none，这些replica不会再其他结点上复制恢复，保持在UNASSIGNED状态
因此集群状态应该是yellow，意味着所有索引的primary都存在可用，只是部分复制片因为上述参数设置的原因，没有立即进行恢复。
重启的结点加入集群，通过master恢复状态信息以后，可以得知那些UNASSIGNED的shard，在这个结点上存在数据。
重新设置cluster.routing.allocation.enable" : "all" ，master得到指令，开始恢复那些UNASSIGNED的shard
对于不再更新的冷shard，由于synced_flush， master知道这些数据在重启的结点上存在并且和primary一致，只需要更新一下集群的状态，将他们allocate到刚启动的结点，并且状态置为started。所以这个过程非常快，看起来瞬间可以完成。
由于集群持续有数据写入，部分primary由于新写入了数据，重启结点上对应的replica已经out of sync，因此需要进入数据的recovery过程，这个过程可能需要在主副片之间拷贝数据，或者利用translog重放热数据。该过程取决于shard大小，以及实时数据写入量的大小，需要一些时间，可能几分钟到几个小时，直到primary -replica完全in-sync，才会将replica置为started。

如果同时重启2个或者更多结点，会是怎样的？

这种情况下，有可能某个shard的primary和replica同时变成UNASSIGNED了，集群状态变成red。如果结点重启好全部加入集群，即使cluster.routing.allocation.enable设置为none，本地的primary shard因为不受这个参数约束，会立即开始做existing_store类别的恢复。等全部primary恢复好以后，集群状态变成yellow，然后不再继续恢复replica，直到重新设置cluster.routing.allocation.enable为all。

所以，cluster.routing.allocation.enable: "none"，实际上影响的是已有索引(local存在)的replica，以及新创建索引的primary和replica。

至于停掉结点后，集群查询延迟增加，是因为重启结点上的查询会由剩余的结点分担，多少延迟会增加一些。

Elastic 中国开发者大会 2021 开启了，预热铁粉票已开抢，手慢无！

活动 • liaosy 发表了文章 • 0 个评论 • 5514 次浏览 • 2021-11-11 17:45 • 来自相关话题

Shay Banon: 关于“Open” Distro、开源和公司建设的几点思考

资讯动态 • medcl 发表了文章 • 1 个评论 • 6149 次浏览 • 2019-03-13 10:19 • 来自相关话题

Shay 的一篇文章，分享一下，关于 Elastic、开源及社区。 https://www.elastic.co/blog/on ... mpany Elastic 关注的焦点始终是：开发强大的产品，围绕这些产品构建社区，并帮助用户实现成功。我在 2009 年坐下来编写了 Elasticsearch 最初的几行代码，并以开源方式提供给用户。因此我放弃了原来的工作，花了两年时间开发产品并围绕这些产品打造杰出的社区。在 2012 年，我们围绕所开发的产品创建了公司：Elastic。我们投入巨大精力维持用户社区，并且采用围绕这一社区而开发的开源产品生态系统。我们向 Apache Lucene 中新添了多得数不清的功能，将其打造成无比坚固的基石，以方便所有人在其基础上进行开发。我们增加了 Kibana（由 Rashid 开发）、Logstash（由 Jordan 开发）和 PacketBeat（由 Monica 和 Tudor 开发）等等，不胜枚举。我们开发产品，围绕这些产品打造社区，并专注于为用户提供最大价值。现在，我们有数百名 Elastic 的开发人员每天都在努力工作，致力于实现这一承诺。每天都有数十万名社区用户帮助我们取得共同成功。对于我们为打造强大社区而创建的这家公司，我感到无比自豪。我们与用户群体之间已经建立了很大程度的信任，我对此既感到骄傲，也感到自己身负重任。我们从成立之初就是一家开源公司，并且我们在所有事务中也一直坚持全心全意为社区和广大用户服务。我们同时还专注于确保任何事情都不能让我们偏离初衷。公司成立多年以来，我们一直面临着来自外界的担忧、不确定性和质疑。如果开发的产品大获成功，这种事情肯定会发生。这种担忧、不确定性和质疑主要来自大型（超大型）公司，因为他们担心这一发展势头会对他们不利。这是很自然的事情。“千万别使用这款产品，它就是个玩具罢了。” “这款产品只有这么几个开发人员，如果他们遭遇车祸，接下来怎么办呢？” “他们根本不知道‘企业’的需求。” “他们关于 X、Y 或 Z（插入适用于您的时下热门词汇）的说法根本不对。” 我们绝不会被这些言论左右，也不会介意这些说法。这些言论的目的就是为了分散我们和我们社区的精力，让我们偏离初衷，让我们不能继续开发用户喜欢的优秀产品，让我们不能专注于打造用户热爱的卓越社区。如果我们纠结于这些言论，那就愧对了用户对我们的期望，而我们绝对不会让用户失望。我们的产品被不断地复刻、重新分发和重新打包，次数多到我都数不清了。这代表我们的产品十分成功，使用范围越来越广泛。这些复刻、重新分发和重新打包的公司各式各样，既有各家供应商，也有大型中国企业，而这次就是 Amazon。凡事皆有“原因”，但有时这些原因会被蒙上“大公无私”或“造福公众”的虚伪面具。这些复刻、重新分发和重新打包的产品却没有一个能维持长久。这些公司开发此类产品是为了达到自己的目的，混淆视听，并分裂社区。我们致力于开发用户喜欢的优秀产品并打造用户热爱的卓越社区，正是这一承诺和专注支持我们发展到今天，广大用户对这一点也十分认同。我们已经和您建立了极大的信任，创新速度能够满足您的期望，并且彼此之间的配合也都十分融洽，这一点毫无疑问，大家都看到了。我们坚信开源理念，也坚信这一理念所赋予的力量。同时，我们从一开始就与大家沟通过，某些功能将是商用功能，并且说明了原因。我相信，我们公司之所以能够取得共同成功，这与我们坚守诚信密不可分。我们编写开源代码时坚持这样的方式：可以向其中添加插件，并允许用户干净地加以实施。我们的这一方式从最初一直不曾改变，多年以来，我们之所以能与广大用户建立信任，正是因为我们一直坚守承诺并努力服务于用户。我们的商用代码一直都是其他公司的“灵感来源”，有很多公司直接复制我们的代码，甚至将这些代码用于特定的分发包或者复刻版本中，最新推出的 Amazon 产品就是一个例子，很不幸，其中包括多个关键故障，会给用户造成巨大麻烦。我们一直专注于开发用户喜欢的优秀产品，并打造用户热爱的卓越社区。我们并未因为其他公司的这些行为而偏离初衷，这一专注给我们带来了十倍的回报。我们的品牌已经很多次遭滥用、盗用和不实呈现。很多公司都故意错误地声称他们与我们公司之间有合作，其中就包括 Amazon。然而这些行为并未让我们偏离初衷，我们一直专注于开发用户喜欢的优秀产品，并打造用户热爱的卓越社区。不能专心行事是公司发展的大忌，所以我们绝不会让这些公司的举动左右我们。最重要的是您，我们的用户，而不是围绕产品周围的熙攘噪音。如果收购其他公司的话，我们会开放源码。当开始看到用户将 Elastic 产品用于 APM 用例时，我们所有人都感到无比兴奋。我们曾收购 OpBeat（APM 领域一家专门从事 SaaS 业务的公司），这是我们公司的一项重大商业投资，然后我们将大部分内容都开源提供给用户，并让用户能够自由使用全部这些内容。决策过程就这么简单，因为我们专注于开发用户喜欢的产品，并打造用户热爱的社区，所以作为我们的用户，您理应使用这些产品。在其他公司封闭源码的同时，我们却在开放源码。我们的开源代码一直都是一样的，而且都基于同样的许可证，同时我们还加大力度争取在公司层面越来越开放。我们针对现有商用代码使用了另外一套更加宽容的许可证，并且开放了源码。我们希望在从事的所有事情中，都能打造与我们的开源代码相同程度的协作和透明度。与用户进行过多场讨论后，我们决定通过这种方式来直接满足用户的需求，看到大家对此种做法如此认同，我感到十分高兴。自此之后，我们在开源方面的投入一直在增加，同时也致力于提供更多免费功能和体验（已明确地进行标志和分发）。其他公司看到我们取得成功，便与我们联系要求建立特殊的合作关系以就代码进行协作，要求获得优待以便凌驾于我们的用户之上，这时我们的答案很简单：不行。这些年来，这样的事情发生了很多次，最近又发生了一次，那就是 Amazon。有些公司遵守我们的宗旨，并成为了我们和社区的优秀合作伙伴。很遗憾，其他公司则未能做到。我们承诺：我们会同等对待每一位帮助我们开发产品的开发人员。任何人都没有优先权，如果有人要求优先权，我们会断然拒绝所有此类要求。我们的答案从始至终只有一个：发送提取请求，和所有其他人一样。质量将会说明一切。我之所以写下上面这些内容，主要有下列几项原因。首先，我们所有人有时都需要自我反省，取得成功靠的是什么，背后的原因又是什么，从而确保我们坚持正确的发展路线。这一点适用于作为我们广大用户的您，适用于我们的社区，也适用于我们公司。第二，我想告诉其他公司，虽然有很多理由会让你们偏离初衷，但还请保持专注，并真正服务于用户，这才是唯一重要的事。最后一点，我想重申我们的承诺：继续开发用户喜爱的产品并打造用户热爱的社区。这是我们的真正目标。在 Elastic，每一天都是第 0 天（与我们所服务的开发人员一样，我们也使用从零开始的计数方法）。从我写下第一行代码，到我们和所有用户经过的 10 年历程，再到未来，我们一直坚守初心。谨此代表 Elastic 向大家表示真诚的感谢。

9月8日 Elastic Meetup 北京线下沙龙报名中

活动 • medcl 发表了文章 • 15 个评论 • 8268 次浏览 • 2018-08-16 17:57 • 来自相关话题

时间：9月8日地点：北京市海淀区上地西路6号，联想研究院圆楼三层报告厅活动页面：https://meetup.elasticsearch.cn/2018/beijing.html 议题：征集中，等你来投稿

58到家搜索服务化实践和演进 -- 邢天宇/五八到家
Elasticsearch在百度aladdin日志系统的应用 -- 王鹏/百度
elasticsearch 在58集团信息安全部的应用 -- 亢伟楠/五八集体
Waterdrop：构建在Spark之上的简单高效数据处理系统 -- 霍晨/新浪网
基于 ElasticSearch 构建个性化推荐和高级搜索 -- 周金阳/果壳网/在行

报名地址：http://elasticsearch.mikecrm.com/fUqiv0T 演讲主题介绍 #1 基于 ElasticSearch 构建个性化推荐和高级搜索 [周金阳]周金阳果壳网/在行算法工程师使用 ES 来构建一个简易却行之有效的个性化推荐系统，以及一些高级搜索排序的实践。搜索排序主要是分享一些机器学习工具与 ES 配合的实践心得。 #2 elasticsearch 在58集团信息安全部的应用 [亢伟楠]亢伟楠58集团资深开发工程师全面介绍 ELK Stack 在58集团信息安全部的落地，升级，优化以及应用。包括如下等方面：接入背景，存储选型，性能挑战，master node以及data node优化，安全实践，高吞吐量以及低延迟搜索优化；kibana 的落地，本地化使其更方便产品、运营使用。 #3 58到家搜索服务化实践和演进 [邢天宇]邢天宇北京五八到家信息技术有限公司 java工程师介绍58到家搜索服务体系的构建和普及，elasticsearch在到家中的各种应用以及优化等等。 #4 Waterdrop：构建在Spark之上的简单高效数据处理系统 [霍晨]霍晨新浪网,大数据研发工程师大数据时代，随着Spark等工具的出现，数据处理能力在逐渐提升。但是Spark本身的开发和运维具有一定的成本，为此我们开源了Waterdrop，通过配置文件的形式配置Spark任务，企图降低Spark的使用门槛，减小开发和运维成本 - 什么是waterdrop - Waterdrop架构介绍 - Waterdrop VS Spark - Waterdrop VS Logstash - Waterdrop的优势 - Waterdrop使用场景 - Roadmap #5 elasticsearch在百度aladdin日志系统的应用 [王鹏]王鹏百度,研发工程师背景：aladdin建库问题相关的case追查，日志统计分析，问题需要解决。方案：使用ES（es版本： 6.0.0）做存储和检索系统，日志以json格式，抽取重要字段建索引，每天一个index，index名字包含时间后缀，保存三天内的数据；建库10个模块，每天有100亿条记录，20T左右数据；使用20个容器做集群。效果：毫秒级返回查询结果，利用kibana实时分析建库情况，同时能方便按需提供数据给业务方。报名地址：http://elasticsearch.mikecrm.com/fUqiv0T Elastic 中国开发者大会 2018，阵容强大，正在火热售票中 ? https://conf.elasticsearch.cn/2018/shenzhen.html

开放公开，火力全开：Elastic 宣布公开其商业产品 X-Pack 的源代码

资讯动态 • medcl 发表了文章 • 21 个评论 • 17135 次浏览 • 2018-02-28 12:47 • 来自相关话题

by Elastic CEO Shay Banon 原文

我很高兴的宣布，我们将公开我们 X-Pack 特性的所有代码 - Security、Monitoring、Alerting、Graph、Reporting、专门的 APM UI、Canvas、Elasticsearch SQL、Search Profiler、Grok Debugger、Elastic Maps Service zoom levels 以及 Machine Learning - 为了促进我们与客户及社区的更大的协作，正如我们今天为我们的开源代码所做的一样。

我为我们公司围绕我们的开源产品而自豪，一直以来我们都没有破坏创新或放弃对开放的承诺。当我们展望未来的时候，我们看到了一个机会，让我们更加坚信开放，甚至更加彻底，同时引入一个新的、更加高效的模式来构建一个成功的、可持续的围绕开源的商业模式。

这篇博客概述了我们做出这些改变的想法和细节，不过，让我澄清一件事 - 我们是一家开源软件公司。我们将继续保持为一家开源软件公司。我们比以往任何时候都要更加开放，我个人，我的团队，整体而言，都致力于此。

为什么开源?

当我第一次开始写 Elasticsearch 的时候，我知道它必须是开源的。开源作为一种开发模式和分发方式，提供了接触更多人的机会。所有这些人都能做出贡献。当然，通过代码可以做出贡献，但也可以通过使用免费的软件，持续不断的推进可能的边界。

与社区的合作可以确保，当你的项目成功时，会有一群热情的、专门的开发者指导你的特性开发，并将产品推向新的有趣的方向。例如，将聚合功能引入 Elasticsearch 让其可被当做一个可扩展的用于数据分析的产品。而像 Kibana 和 Logstash 这样的项目，以及后来的 Beats 的加入，无不令人鼓舞。随着我们用户的需求变得更加深入和专业，我们总能找到新的方法来支持他们，有些是通过新的功能、有些是产品，比如机器学习、APM 和站内搜索。

我们对开源的承诺深入了。这是我们花费大部分工程力量投入的地方，我们的社区贡献者和用户对我们创新进程也同样至关重要。但是，像我们这样快速推进产品的发展，需要大量的投资，这也是我们围绕这些技术成立一家公司的原因。

为什么商业软件?

那么，如果我们对开源软件已有如此深的见解，那为什么还是编写了商业软件呢？

我们是一家企业。作为企业的一部分，我们相信那些能够付款给我们的企业，应该付款给我们。而那些不能的，他们也不必付款给我们。作为回报，我们有义务确保我们继续添加功能和价值给我们所有的用户，并确保与我们的商业关系对客户有益。这是一家健康的公司所需要的平衡。

销售支持订阅服务是一个常见的开源软件的商业模式。可悲的是，只有支持的商业模式会朝向关于什么对用户最好以及什么对公司最好这样的冲突之中。在这种情况下，公司将没有动力让他们的产品更加简单好用，更加稳固和可扩展，因为那意味着这将吞噬其技术支持的利益。我们从来没有，也永远不会忍受为了确保公司继续经营而不让我们的软件变的更好。我们想要继续改进，我们支持服务的目标是让你的项目成功，然后你能成为你自有 Elastic Stack 部署的专家。

另外一种办法 -- 如果你们听过我的演讲，你们可能听我讨论过这个问题 -- 即构建一个‘企业版’的软件。这种，从本质上来讲，导致了社区的分裂，并在客户和用户之间产生了分歧。它的结果就是创建一种版本 -- 要么企业版，要么社区版 -- 被认为是权威的，往往滞后 master 很多。一个缺少特性的版本。一个在不同周期测试和发布的版本。一个有效的关闭了源代码的版本，因为您无法知道为了支持商业特性而更改了哪些内容。在 Elastic，所有我们的客户同时也是我们开源软件用户，使用相同版本的软件产品。我们不会创建一个社区版与企业版的版本。

那还有什么？识别高价值特性并将其作为核心软件的商业扩展。这种商业模式，我们有时候叫它“open core”，这是我们创造 X-Pack 的最终产物。为了构建和集成由我们维护知识产权（IP）的特性和功能，并提供订阅服务或免费的基础授权。保持我们对知识产权的控制，使我们能够有能力投资我们大部分的工程资源和时间，可以继续改进我们的核心，我们的开源产品。

这种方法使我们能够在世界各地建立一个分布式的公司，让我们感到惊讶的是，Elastic Stack 是如何被用来解决各种实际的、具体的问题的。添加适用于我们用户的特性和功能，并开发一些使我们能够持续到未来的功能。

但是这种方法也存在挑战…

更加开放

你是否知道 X-Pack 提供了一层免费的功能？这些能力诸如 Monitoring、Search Profiler、Grok Debugger 以及额外的 Elastic Maps 缩放级别。你是否知道我们还将在这一层继续添加更多功能，如 Canvas 和 Elasticsearch SQL？

当我们往X-Pack 里添加免费功能的时候，我们这么做是因为我们知道这些功能可以帮助用户更好的使用 Elastic Stack。不幸的是，太多功能你都不知道 -- 也许知道 -- 或得益于这些功能。所以这意味着有很大一部分用户在使用我们软件的时候往往不是最佳实践。

我们也知道，获得这个免费软件的过程是一个糟糕的用户体验，涉及到一个完整的集群重启。并且如果你想查看代码，抱歉，不可以。尤其是这些免费功能和很大一部分用户相关，你会问我们一些很好但是很难的问题，比如：“我如何就这些免费功能与你们交互？”，“我如何开启一个 issue 或是贡献代码？”

而我们没有很好的答案。

通过公开 X-Pack 的代码，我们解决了这些我们部分产品开源以及部分产品不是的问题。很快，所有的免费的和商业的特性你都可以开启一个 issue、查看特性讨论、检查源代码、与我们协助和提交一个 pull request。

具体细节

这意味着什么，技术上来说？

自 6.3 版本起，所有 $PRODUCT（项目）仓库(Elasticsearch, Logstash, Kibana, Beats) ：

所有现存的 Apache 2.0 协议的代码都将保持相同的协议，什么都不用动。
我们会创建一个新的 X-Pack 目录，将 x-pack-$PRODUCT 的代码放入到该目录，基于 Elastic EULA 协议，允许相应的衍生和贡献。
我们将修改最顶层的协议为一个简单的 Elastic License，包含这个仓库里面那些文件是Apache 2.0，那些是 Elastic EULA 的详细细节。

同时，X-Pack 功能将打包到默认的发行版里面。所有免费的功能都包含在里面且默认开启且永远不会出现‘过期’，而商业特性则可以通过试用证书可选的启用。因为免费的证书永远不会过期，所以你再也不用通过注册来就直接获取它了。除此以外，一个只包含 Apache 2.0 协议代码的包也会同样会创建并提供下载。

更多信息以及常见问题，可以在 Opening X-Pack 页找到。

总结

我们相信开源。作为一种分布模式。作为一种建立企业的方法。作为我们公司的未来。我们承诺并保持我们将保持开放，并对我们将在 6.3 比以往任何时候都更加开放而感到兴奋。

感谢你们对我们的信任。

Elastic 在年度用户大会 Elastic{ON} 2018 上发布众多新功能和技术预览

资讯动态 • medcl 发表了文章 • 1 个评论 • 6931 次浏览 • 2018-02-28 12:39 • 来自相关话题

下载超过 2.25 亿次，Elastic 公开 X-Pack 源代码

旧金山 (Elastic{ON} 2018) – 2018 年 2 月 27 日 – Elastic，Elasticsearch 和 Elastic Stack背后的公司，今天宣布其产品累计下载次数达到 2.25 亿次的里程牌，去年累计下载次数是 1 亿。除此之外，Elastic 宣布公开其X-Pack 的源代码作为策略的一部分，让用户更容易地下载、检查和与 Elastic 工程团队一起在 X-Pack 特性开发上进行协作。给用户更简单的下载、检查及协助。X-Pack 目前包括了 security、alerting、monitoring、Graph 和machine learning 等众多功能。

“我们的产品被数以百万计的开发人员和成千上万的客户所依赖，他们依靠这些产品来驱动关键型业务，这令我们受宠若惊，” Elastic 创始人兼 CEO Shay Banon 表示， “正如他们与我们开源的产品打交道的一样，公开我们的 X-Pack 源代码能给我们的用户完全的透明度和具备与我们一起协助的能力。这样可以激励每一位开发人员、客户和使用我们软件的合作伙伴，帮助我们创造更好的产品和特性以及允许我们构建一个可持续发展的商业模式。”

Elastic 在过去18个月内收购了三家新公司，并在全世界发展了超过 100,000 多位开发者的技术社区。 Elastic{ON} 2018，是一个最大型的 Elasticsearch 用户聚集的大会。在三天的时间里，超过 2500 名与会者聚在一起学习和分享创意，观看新功能的发布，并获得即将发布的新技术的预览。

Elastic APM: 这是 Elastic APM 第一个可被用于生产环境的版本，作为 Elastic 产品栈进入应用性能监控领域的一个延伸。它允许应用程序开发人员和 devops 工程师能够监视和分析特定的代码行对系统和业务性能的影响。这不仅仅是提升速度，同时也能扩展调试流程，将代码性能变化与操作历史有机结合。Elastic APM 将数据存储到 Elasticsearch 的索引里面，允许将 APM 数据与来自 Logstash 或者 Beats 的日志和监控指标进行关联分析，包含针对 Nodejs、Python、Ruby 和 JavaScript 的服务端组件和探针。还提供一个 APM 分析应用来实施典型的 APM 工作流。Elastic APM 已经作为 6.2 发布的一部分可被下载。
Swiftype App Search: 为开发者构建用以为他们的应用程序提供强大的搜索能力，Swiftype App Search 交付一系列稳健的 API 和额外的搜索相关的特性，如搜索结果重排、同义词和容错等。Swiftype App Search 是一个一站式的 Saas 解决方案，不需要基础设施、管理和维护，提供一个简单上手的用户体验。 Swiftype App Search 现已公测。
Machine Learning Forecasting: Elastic 机器学习能力的第一个主要扩展，用于预测分析领域。用户可以对时间序列数据进行建模，并使用复杂的、现成的机器学习算法来预测未来可能发生的结果。借助按需预测，用户可以使用现有的机器学习工作，并使用内置的预测模型，来准确预测改模型在预测周期内的增长情况。预测结果被写入到 Elasticsearch 的索引中，用户可用来和实际的数据进行比较。Elastic 的机器预测能力已包含在 6.2 的版本里面。
GIS App: Elastic 的一个全新研究项目，GIS（地理信息系统）是一个被设计用来捕获、存储、操作、分析、管理和呈现所有地理类型数据的系统。作为 Kibana 的一部分，这个应用让你以一种全新的方式来执行特定的地理位置分析，在 Dashboard 里面加入内置的增强地图可视化组件。它的核心特性包括，多层地图的支持，映射独立的坐标点和用户端样式自定义。GIS App 目前已提供技术预览版。
SQL for Elasticsearch: 这个新特性为世界上最成熟的 SQL 数据库开发人员打开了释放 Elastic Stack 强大能力的大门，允许用户用熟悉的 SQL 语法来查询 Elasticsearch 里面的数据。JDBC 协议的支持，大大的简化了将 Elasticsearch 导出到外部 SQL 环境使用的情况。通过允许 Elasticsearch 通过 RESTful 协议理解 SQL，Elasticsearch SQL 允许你使用 SQL 语法来查询 Elasticsearch 里面的数据，以 SQL 引擎一致的表格形式返回那些查询结果，并提供一个用户接口来探索这些数据。Elasticsearch SQL 去年还只是作为一个概念被推出，现在马上将发布 alpha 和 beta 版本。
Canvas: Canvas 为下一代数据可视化和数据呈现展现了一个全新的篇章。随着 Kibana 越来越受欢迎，Canvas 展现了一种新的方式，可以将数据从 Elasticsearch 中获得的洞察赋予在线的、实时的仪表盘、幻灯片演示和信息图表。Canvas 能让用户能以一种前所未有的方式来表达 Elasticsearch 数据背后的故事，消除将数据导出到 Excel 中的详尽、重复和耗时的过程，来构建 PowerPoint。 Canvas 同样也是可插拔的，允许用户带来新的数据源、可视化类型和 UI 可视化组件。Canvas 去年作为一个概念被提出，目前已提供技术预览版可被下载。
Rollups: 一般来说，具备关联的指标和日志数据需要长时间保存，rollups 可以让用户存储有限的数据集，减少历史数据的磁盘占用。Elasticsearch 的 rollup 作业可以让用户配置一个定时任务来对数据进行 “rollup” 或预聚合，并保存结果到一个索引。举一个指标监控的例子，如：“web 服务器每小时的平均负载”，也就是说，平均数据被 rollup 起来并存储，但是其它原始数据，如特定用户、页面、IP 信息却不会。该功能将很快在 Elasticsearch 里面提供测试版本并随后在 Kibana 里面提供支持。
Flexible Deployment Configurations: 随着客户将随着越来越多的数据放进 Elasticsearch 并扩展越来越多的使用场景，Elastic 引入 “sliders” 功能来让用户获得定制他们集群配置的能力。Elastic Cloud 和 Elastic Cloud Enterprise (ECE) 客户将获得这些新能力：支持多种类型的硬件可供选择；支持集群模板和 hot/warm 集群；给现有集群添加机器学习节点、独立 master 节点和 APM 节点的能力。这些新特性很快将能在 Elastic Cloud 和 Elastic Cloud Enterprise 上可用。
Logstash Azure Monitoring Module: 通过与微软合作，Logstash Azure 监控模块目前是借助 Elastic Stack 监控你的 Azure 基础设施和服务的最简单的方式。新模块集成了 Azure 的集中式日志服务来标准化 Azure 日志和指标，并转换成 JSON 格式。使用 Logstash 来消费这些数据录入到 Elasticsearch。同时借助 Kibana，用户能够分析基础设施的改变和授权信息；识别可疑的行为和潜在的恶意用户；通过调查用户行为来执行根源分析；监控和优化 SQL 数据库的部署。该功能将很快提供 beta 版本。

最后，Elastic 宣布一个新的、官方的 Elastic 认证计划。在用户要求获得专业认证的推动下，Elastic 将为用户提供新的培训课程，让他们成为专家，并通过 Elastic 认证。新课程 Elasticsearch Engineer I 和 Elasticsearch Engineer II 将为用户提供安装、管理和优化 Elasticsearch 集群的第一手知识，也包括，开发新的解决方案来分析他们的数据。这些课程是成为一名 Elastic 认证工程师的基础，包括动手、技术和基于性能的认证考试，通过考试将获得由官方颁发的 Elastic 电子认证徽章。

了解更多

Elastic Opening X-Pack Blog Opening X-Pack FAQ Elastic Certification Elastic Cause Awards

关于 Elastic

Elastic 致力于构建大规模实时数据处理软件，场景主要涵盖搜索、日志、安全与数据分析等领域。公司成立于 2012 年，旗下拥有产品包括开源的 Elastic Stack（Elasticsearch、Kibana、Beats 和 Logstash）、 X-Pack （商业特性）和 Elastic Cloud （一种托管服务）。迄今为止，这些产品的累积下载次数已超过 2.25 亿。Elastic 由 Benchmark Capital、Index Ventures 及 NEA 投资，投资额超过 1 亿美金。Elastic 拥有超过 800 位员工，分布于世界上 30 多个国家和地区。欲了解详情请访问：elastic.co。

媒体联系人：

Michael Lindenberger

Reidy Communications for Elastic

Michael@reidycommunications.com

(415) 531-1449

亚太地区 Jeff Yoshimura

Communications @ Elastic

pr@elastic.co

Elastic Stack 全新推出 6.0.0

资讯动态 • medcl 发表了文章 • 2 个评论 • 6824 次浏览 • 2017-11-15 13:34 • 来自相关话题

https://www.elastic.co/cn/blog/elastic-stack-6-0-0-released

全新推出 6.0.0。

无需多说。你应该立即下载试用，或者通过你最喜欢的托管式 Elasticsearch 和 Kibana 提供平台 Elastic Cloud 亲身体验。

如果你在过去几个月没有跟上我们的发布节奏，可能会对今天的公告感到意外。今天标志着成千上万的 pull 请求和成百上千位代码提交者的努力终见成效。期间共有两个 alpha 版本、两个 beta 版本、两个候选版本以及最终的通用版本 (GA)。这个里程碑离不开 Elastic 各路团队的努力。还要感谢参与先锋计划的用户提出的意见和反馈。

今天，我们不仅发布了整套 Elastic Stack，还发布了 Elastic Cloud Enterprise 1.1，其中包括 6.0 支持、离线安装，并且对用户体验进行了一系列改进，旨在简化集群的配置、管理和监控。同天发布多款产品的正式版本还不够……还有仍是 Alpha 版本的 APM ，我们邀请大家在 6.0.0 中对它进行测试。

一个版本有如此多的亮点，该从哪里说起呢？你们撰文细述也好，提供详情链接也好，祝你们有愉快的阅读体验……更重要的是……祝你们有愉快的搜索、分析和可视化体验。