文章 - 搜索客，搜索人自己的社区

社区日报第14129期 (2022-06-21)

1. ES可以拿来做数据分析和机器学习吗？（需要梯子）
https://medium.com/analytics-v ... 5c250
2. ES在量化交易里的应用之RSI交叉策略（需要梯子）
https://medium.com/geekculture ... a72a1
3. 我们在shipt是怎么做搜索的（需要梯子）
https://shipt.tech/search-rele ... 6504e
编辑：斯蒂文
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1428期 (2022-06-20)

1. Elasticsearch 评分机制
https://www.jianshu.com/p/2624f61f1d02

2. Elasticsearch 容量评估
https://developer.aliyun.com/article/801908

3. Elasticsearch 安全设置
https://blog.csdn.net/UbuntuTo ... 07480

编辑：yuebancanghai
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1427期 (2022-06-19）

1. 来自微软的创意：使用kibana浏览其他数据源的数据
https://docs.microsoft.com/zh- ... erger
2. ElasticSearch 支持矩阵，辅助评估版本升级
https://www.elastic.co/cn/support/matrix

3. ElasticSearch 查询不稳定问题解决
https://blog.csdn.net/weixin_4 ... 69647

编辑：cyberdak
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第14126期 (2022-06-18)

1、 x-pack 设置 Elasticsearch 访问保护以及相关的客户端代码适配的功能
https://juejin.cn/post/7108898814286643214
2、Spring Boot 集成Elasticsearch实现简单查询
https://juejin.cn/post/7108331484494184455
3、如何用 Python 中的批量 API 对 Elasticsearch 文档进行索引
https://towardsdatascience.com ... d3824（需要梯子）

编辑：李静
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1425期 (2022-06-17)

1、又见Elasticsearch“裸奔”导致数据泄露事件
https://www.theregister.com/20 ... leak/
2、rust版本的Elasticdump
https://github.com/saiumesh535/elastic-dump-rust
3、推荐一款小众开源的搜索引擎
https://github.com/meilisearch/meilisearch

编辑：铭毅天下
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站： https://ela.st/bilibili

继续阅读 »

社区日报第1424期 (2022-06-16)

1.Elasticsearch 内存管理和故障排查
https://www.elastic.co/cn/blog ... emory
2.搞崩 Elasticsearch 集群的 6 种方法
https://www.elastic.co/cn/blog ... earch
3.开源 Elasticsearch FAQ
https://help.aliyun.com/docume ... x-p8b

编辑：Se7en
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站： https://ela.st/bilibili

继续阅读 »

社区日报第1423期 (2022-06-15)

1. 两小时 Elasticsearch 性能优化，直接把慢查询干团灭了……
https://mp.weixin.qq.com/s/IN2R1_QJgt_Ck80AOWKciA
2. ES写入调优完全手册（需要梯子）
https://luis-sena.medium.com/t ... f9e92
3. 从lucene层面分析ES的性能表现（需要梯子）
https://medium.com/%40alibaba- ... 2f347

编辑：kin122
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1422期 (2022-06-14)

1. 我想优化索引速度该怎么做？（需要梯子）
https://medium.com/trendyol-te ... 041dc

2. 用Elasticsearch的向量能力帮忙构建搜索引擎（需要梯子）
https://medium.com/carousell-i ... 155fc

3. 在SOC我们是怎么用ES的（需要梯子）
https://blog.devgenius.io/soc- ... 19f0c

编辑：斯蒂文
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1420期 (2022-06-12）

1. 基于 Elasticsearch 的分布式数据库CrateDB
https://www.51cto.com/article/709633.html

2. 来自蚂蚁的Elasticsearch 容量评估
https://tech.antfin.com/docs/2/72660

3. Elastic 社区资深布道师，分享也是一种快乐
https://blog.csdn.net/ubuntuto ... 11543

编辑：cyberdak
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1421期 (2022-06-13)

1. Elasticsearch 如何实现相似推荐功能
https://cloud.tencent.com/deve ... 91540

2. Elasticsearch 向量搜索的工程化实战
https://ost.51cto.com/posts/11594

3. 京东：商品搜索系统架构设计
https://www.infoq.cn/article/j ... q.com

编辑：yuebancanghai
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1419期 (2022-06-11)

1、如何解决 spring-data-elasticsearch 日期、时间类型数据读取报错问题
https://juejin.cn/post/7104138567479197703
2、如何搭建 ELK（Elasticsearch, Logstash, and Kibana）系统
https://zijiancode.cn/archives/elkmd
3、elasticsearch 聚合查询如何在 java client 中实现
https://juejin.cn/post/7105199846608338957

编辑：李静
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

社区日报第1418期 (2022-06-10)

1、Flask + Elasticsearch python dsl 包实现
https://medium.com/%40demianch ... 42e61
2、Django + Elasticsearch 实战
https://testdriven.io/blog/dja ... arch/
3、Kafka Connect Elasticsearch Sink Connector实现
https://www.kloia.com/blog/kaf ... 31736

编辑：铭毅天下
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站： https://ela.st/bilibili

继续阅读 »

社区日报第1417期 (2022-06-09)

1. 23 个有用的 Elasticsearch 示例查询
https://dzone.com/articles/23- ... eries
2. 大规模分析您的 Prometheus 指标: Prometheus + Elasticsearch
https://cloud.tencent.com/deve ... 16282
3. 字段太多，在 Elasticsearch 中防止映射爆炸的 3 种方法
https://blog.csdn.net/UbuntuTo ... .5501

编辑：Se7en
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站： https://ela.st/bilibili

继续阅读 »

社区日报第1416期 (2022-06-08)

1. Elasticsearch：如何部署 NLP：情绪分析示例
https://elasticstack.blog.csdn ... 44885
2. 几分钟把Twitter数据流化并可视化到 Elasticsearch（需要梯子）
https://medium.com/%40sean1223 ... 09f3d
3. Elastic APM 和 OpenTelemetry 集成
https://cloud.tencent.com/deve ... 13362

编辑：kin122
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup
B站：https://ela.st/bilibili

继续阅读 »

Elasticsearch：字段太多，在 Elasticsearch 中防止映射爆炸的 3 种方法

当一个系统具有三样东西时，它就被称为“可观察的”：日志、指标和跟踪。虽然指标和跟踪具有可预测的数据结构，但日志（尤其是应用程序日志）通常是非结构化数据，需要收集和解析才能真正有用。因此，控制日志可以说是实现可观察性最难的部分。如果你想了解如何把一个数据进行结构化，请参考我之前的文章 “Elasticsearch：Elastic可观测性 - 运用 pipeline 使数据结构化”。你可以在 “Elastic：开发者上手指南” 查找更多的文章。

在本文中，我们将深入探讨开发人员可以用来通过 Elasticsearch 管理日志的三种有效策略。

[相关文章：利用 Elastic 改善云中的数据管理和可观察性]

让 Elasticsearch 为你的数据工作
有时我们无法控制我们在集群中收到的日志类型。想想一个日志分析提供商，它有一个特定的预算来存储其客户的日志，并且需要保持存储空间（Elastic 在咨询中处理了许多类似的案例）。

通常情况下，我们有客户索引字段 “以防万一” 他们需要用于搜索。如果你是这种情况，那么以下技术在帮助你降低成本并将集群性能集中在真正重要的事情上应该被证明是有价值的。

让我们首先概述问题。考虑以下具有三个字段的 JSON 文档：message、transaction.user、transaction.amount：

{
"message": "2023-06-01T01:02:03.000Z|TT|Bob|3.14|hello",
"transaction": {
"user": "bob",
"amount": 3.14
}
}
将保存此类文档的索引的映射可能类似于以下内容：

PUT dynamic-mapping-test
{
"mappings": {
"properties": {
"message": {
"type": "text"
},
"transaction": {
"properties": {
"user": {
"type": "keyword"
},
"amount": {
"type": "long"
}
}
}
}
}
}
但是，Elasticsearch 允许我们为新字段编制索引，而不必事先指定映射，这也是 Elasticsearch 易于使用的部分原因：我们可以轻松载入新数据。因此，可以对偏离原始映射的内容进行索引，

更多阅读 https://elasticstack.blog.csdn ... 59151

继续阅读 »

当一个系统具有三样东西时，它就被称为“可观察的”：日志、指标和跟踪。虽然指标和跟踪具有可预测的数据结构，但日志（尤其是应用程序日志）通常是非结构化数据，需要收集和解析才能真正有用。因此，控制日志可以说是实现可观察性最难的部分。如果你想了解如何把一个数据进行结构化，请参考我之前的文章 “Elasticsearch：Elastic可观测性 - 运用 pipeline 使数据结构化”。你可以在 “Elastic：开发者上手指南” 查找更多的文章。

在本文中，我们将深入探讨开发人员可以用来通过 Elasticsearch 管理日志的三种有效策略。

[相关文章：利用 Elastic 改善云中的数据管理和可观察性]

让 Elasticsearch 为你的数据工作
有时我们无法控制我们在集群中收到的日志类型。想想一个日志分析提供商，它有一个特定的预算来存储其客户的日志，并且需要保持存储空间（Elastic 在咨询中处理了许多类似的案例）。

通常情况下，我们有客户索引字段 “以防万一” 他们需要用于搜索。如果你是这种情况，那么以下技术在帮助你降低成本并将集群性能集中在真正重要的事情上应该被证明是有价值的。

让我们首先概述问题。考虑以下具有三个字段的 JSON 文档：message、transaction.user、transaction.amount：

{
"message": "2023-06-01T01:02:03.000Z|TT|Bob|3.14|hello",
"transaction": {
"user": "bob",
"amount": 3.14
}
}
将保存此类文档的索引的映射可能类似于以下内容：

PUT dynamic-mapping-test
{
"mappings": {
"properties": {
"message": {
"type": "text"
},
"transaction": {
"properties": {
"user": {
"type": "keyword"
},
"amount": {
"type": "long"
}
}
}
}
}
}
但是，Elasticsearch 允许我们为新字段编制索引，而不必事先指定映射，这也是 Elasticsearch 易于使用的部分原因：我们可以轻松载入新数据。因此，可以对偏离原始映射的内容进行索引，

更多阅读 https://elasticstack.blog.csdn ... 59151 收起阅读 »

社区日报第14129期 (2022-06-21)

社区日报第1428期 (2022-06-20)

社区日报第1427期 (2022-06-19）

社区日报第14126期 (2022-06-18)

社区日报第1425期 (2022-06-17)

社区日报第1424期 (2022-06-16)

社区日报第1423期 (2022-06-15)

社区日报第1422期 (2022-06-14)

社区日报第1420期 (2022-06-12）

社区日报第1421期 (2022-06-13)

社区日报第1419期 (2022-06-11)

社区日报第1418期 (2022-06-10)

社区日报第1417期 (2022-06-09)

社区日报第1416期 (2022-06-08)

Elasticsearch：字段太多，在 Elasticsearch 中防止映射爆炸的 3 种方法

热门文章

热门话题