文章 - 搜索客，搜索人自己的社区

Elasticsearch：如何实现对 emoji 表情符号进行搜索

Elasticsearch 是一个应用非常广泛的搜索引擎。它可以对文字进行分词，从而实现全文搜索。在实际的使用中，我们会发现有一些文字中包含一些表情符号，比如笑脸，动物等等，那么我们该如何对这些表情符号来进行搜索呢？

🏻 => 🏻, light skin tone, skin tone, type 1–2
🏼 => 🏼, medium-light skin tone, skin tone, type 3
🏽 => 🏽, medium skin tone, skin tone, type 4
🏾 => 🏾, medium-dark skin tone, skin tone, type 5
🏿 => 🏿, dark skin tone, skin tone, type 6
♪ => ♪, eighth, music, note
♭ => ♭, bemolle, flat, music, note
♯ => ♯, dièse, diesis, music, note, sharp
😀 => 😀, face, grin, grinning face
😃 => 😃, face, grinning face with big eyes, mouth, open, smile
😄 => 😄, eye, face, grinning face with smiling eyes, mouth, open, smile
😁 => 😁, beaming face with smiling eyes, eye, face, grin, smile
😆 => 😆, face, grinning squinting face, laugh, mouth, satisfied, smile
😅 => 😅, cold, face, grinning face with sweat, open, smile, sweat
🤣 => 🤣, face, floor, laugh, rofl, rolling, rolling on the floor laughing, rotfl
😂 => 😂, face, face with tears of joy, joy, laugh, tear
🙂 => 🙂, face, slightly smiling face, smile
🙃 => 🙃, face, upside-down
😉 => 😉, face, wink, winking face

🐅 => 🐅, tiger
🐆 => 🐆, leopard
🐴 => 🐴, face, horse
🐎 => 🐎, equestrian, horse, racehorse, racing
🦄 => 🦄, face, unicorn
🦓 => 🦓, stripe, zebra
🦌 => 🦌, deer
在上面，我们可以看到各种各样的 emoji 符号。比如我们想搜索 grin，那么它就把含有 😀 emoji 符号的文档也找出来。在今天的文章中，我们来展示如何实现对 emoji 符号的进行搜索。
————————————————
版权声明：本文为CSDN博主「Elastic 中国社区官方博客」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/UbuntuTo ... 61636

继续阅读 »

Elasticsearch 是一个应用非常广泛的搜索引擎。它可以对文字进行分词，从而实现全文搜索。在实际的使用中，我们会发现有一些文字中包含一些表情符号，比如笑脸，动物等等，那么我们该如何对这些表情符号来进行搜索呢？

🏻 => 🏻, light skin tone, skin tone, type 1–2
🏼 => 🏼, medium-light skin tone, skin tone, type 3
🏽 => 🏽, medium skin tone, skin tone, type 4
🏾 => 🏾, medium-dark skin tone, skin tone, type 5
🏿 => 🏿, dark skin tone, skin tone, type 6
♪ => ♪, eighth, music, note
♭ => ♭, bemolle, flat, music, note
♯ => ♯, dièse, diesis, music, note, sharp
😀 => 😀, face, grin, grinning face
😃 => 😃, face, grinning face with big eyes, mouth, open, smile
😄 => 😄, eye, face, grinning face with smiling eyes, mouth, open, smile
😁 => 😁, beaming face with smiling eyes, eye, face, grin, smile
😆 => 😆, face, grinning squinting face, laugh, mouth, satisfied, smile
😅 => 😅, cold, face, grinning face with sweat, open, smile, sweat
🤣 => 🤣, face, floor, laugh, rofl, rolling, rolling on the floor laughing, rotfl
😂 => 😂, face, face with tears of joy, joy, laugh, tear
🙂 => 🙂, face, slightly smiling face, smile
🙃 => 🙃, face, upside-down
😉 => 😉, face, wink, winking face

🐅 => 🐅, tiger
🐆 => 🐆, leopard
🐴 => 🐴, face, horse
🐎 => 🐎, equestrian, horse, racehorse, racing
🦄 => 🦄, face, unicorn
🦓 => 🦓, stripe, zebra
🦌 => 🦌, deer
在上面，我们可以看到各种各样的 emoji 符号。比如我们想搜索 grin，那么它就把含有 😀 emoji 符号的文档也找出来。在今天的文章中，我们来展示如何实现对 emoji 符号的进行搜索。
————————————————
版权声明：本文为CSDN博主「Elastic 中国社区官方博客」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/UbuntuTo ... 61636

收起阅读 »

社区日报第1198期 (2021-02-27）

1.ES对数组中元素个数进行聚合

https://stackoverflow.com/questions/49250267/how-to-get-array-count-of-nested-object-in-elastic-search

2.Kibana查询超时处理方法

https://stackoverflow.com/questions/51950640/elasticsearch-gateway-timeout-504

3.Elasticsearch和Clickhouse基本查询对比

https://my.oschina.net/taogang/blog/4965018

继续阅读 »

社区日报第1195期 (2021-02-23）

1.为什么 ElasticSearch 比 MySQL 更适合复杂条件搜索。
https://z.itpub.net/article/de ... FB51C
2.保障你的elasticsearch安全。
https://dzone.com/articles/the ... urity
3.Elasticsearch和GrayLog详细对比。
https://stackshare.io/stackups ... aylog

编辑：叮咚光军
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1194期 (2021-02-22)

1. Enterprise：推出 Elastic App Search Web 爬虫器
https://elasticstack.blog.csdn ... 45211
2. 留意Elasticsearch 7.x 可能无法选主的问题
https://mp.weixin.qq.com/s/dW3iBeoAgIsm4njjIWHZzA
3.使用Elastic Observability构建Istio监控
https://www.elastic.co/blog/is ... ility

编辑：wt
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

Enterprise：Elastic App Search - Web 爬虫

让内容搜索可通过多种形式实现。Elastic App Search 已经允许用户通过上传或粘贴 JSON 以及通过 API 终端来采集内容。使用 Elastic 企业搜索 7.11，用户现在可以通过功能强大的网络爬虫来采集内容，该爬虫能够从可公开访问的网站中检索信息，从而可以轻松地在你的 App Search 引擎中搜索内容。与 App Search 上的任何采集方法一样，这种模式是在采集时推断出来的，只需单击一下即可进行近乎实时地更新。通过单击（无需写代码），用户就可以定制网络爬虫规则，以便在排除规则指示网络爬虫避免某些页面、内容和术语的同时指定入口点。

https://elasticstack.blog.csdn ... 49006

继续阅读 »

Elastic 7.11 重磅发布：可搜索快照和新冷层的正式版以及读时模式的公测版

我们非常高兴地宣布 Elastic 7.11 版正式发布。这一新版本为基于 Elastic Stack（包括 Elasticsearch 和 Kibana）构建的 Elastic 企业搜索、可观测性和安全解决方案带来了大量新功能。通过这一版本，您可以使用可搜索快照功能正式版和读时模式公测版，在成本、性能、见解和灵活性方面实现优化。

Elastic 企业搜索中公测版的新网络爬虫一经推出，从可公开访问的网站搜索内容就此变得轻而易举。Elastic 可观测性新增了服务运行状况和主机详情视图，能够提供更强大的根本原因分析、故障排除和应用程序可观测性。Elastic 安全中新增了预构建检测规则和 Machine Learning 作业以及可定制的告警通知，使得检测和修复流程都得到了提升，并且统一的分析人员工作区也极大简化了安全运维 (SecOps) 流程。

同时，我们还宣布了对 Elastic Cloud 的多项关键改进，Elastic Cloud 是非常优秀的 Elastic 托管服务，也是唯一一项包含我们解决方案的服务。Elastic Cloud 为可搜索快照、自动缩放数据和 Machine Learning 节点提供了丰富的支持，并通过增强的跨集群复制 (CCR) 和跨集群搜索 (CCS) 提高了可用性，增强了搜索性能。Elastic 7.11 现已在 Elastic Cloud 正式推出，这是唯一一个包含最新版所有新功能的托管型 Elasticsearch 产品。您也可以下载 Elastic Stack 以及我们的云编排产品（Elastic Cloud Enterprise 和 Elastic Cloud for Kubernetes）进行自管型部署。

详细阅读，请参阅文章链接 https://elasticstack.blog.csdn ... 43925

继续阅读 »

Elasticsearch：Runtime fields 入门， Elastic 的 schema on read 实现 - 7.11 发布

从历史上看，Elasticsearch 依靠 schema on write 的架构来快速搜索数据。现在，我们向 Elasticsearch 添加了 schema on read 架构，以便用户可以灵活地在摄取后更改文档的 schema，还可以生成仅作为搜索查询一部分存在的字段。schema on read 和 schema on write 一起为用户提供了选择，可以根据他们的需求来平衡性能和灵活性。

我们的 schema on read 解决方案是 runtime fields，它们仅在查询时进行评估。它们在索引映射或查询中定义，一旦定义，它们立即可用于搜索请求，聚合，过滤和排序。由于未对 runtime fields 进行索引，因此添加运行时字段不会增加索引的大小。实际上，它们可以降低存储成本并提高摄取速度。

但是，需要权衡取舍。对运行时字段的查询可能会很昂贵，因此你通常搜索或筛选所依据的数据仍应映射到索引字段。即使你的索引大小较小，runtime fields 也会降低搜索速度。我们建议结合使用 runtime fields 和索引字段，以在用例的摄取速度，索引大小，灵活性和搜索性能之间找到合适的平衡。

https://elasticstack.blog.csdn ... 13915

继续阅读 »

Elasticsearch：使用 Runtime fields 对索引字段进行阴影处理以修复错误 - 7.11 发布

运行时字段（runtime fields）是在查询时评估的字段。运行时字段使你能够：

将字段添加到现有文档中，而无需重新索引数据
在不了解数据结构的情况下开始使用数据
覆盖查询时从索引字段返回的值
为特定用途定义字段，而无需修改基础架构

你可以像其他任何字段一样从搜索 API 访问运行时字段，Elasticsearch 看到的运行时字段没有任何不同。你可以在 index mapping 或 search request 中定义 runtime fields。这个完全由你来进行选择，这是运行时字段固有的灵活性的一部分。

当使用日志数据时，运行时字段很有用（请参见示例），尤其是在不确定数据结构时。你的搜索速度会降低，但是索引的大小要小得多，你可以更快地处理日志而不必对它们进行索引。
详细阅读，请参阅 https://elasticstack.blog.csdn ... 95062

继续阅读 »

Elasticsearch：可组合的 Index templates - 7.8 版本之后

索引模板（Index template）是一种告诉 Elasticsearch 在创建索引时如何配置索引的方法。自 Elastic Stack 7.8 之后，模板有两种类型：索引模板和组件模板。组件模板是可重用的构建块，用于配置映射，设置和别名。你使用组件模板来构造索引模板，但它们不会直接应用于一组索引。索引模板可以包含组件模板的集合，也可以直接指定设置，映射和别名。详细阅读，请参阅链接 https://elasticstack.blog.csdn ... 51797

继续阅读 »

社区日报第1193期 (2021-02-07)

新年、新开始、新起点、定有新的收获，祝社区朋友们事事如意，岁岁平安，精神愉快，春节快乐。
1.PB级Elasticsearch集群中的最佳Shard放置
https://underthehood.meltwater ... ster/
2.在超级计算机上运行Elasticsearch。
https://www.objectrocket.com/b ... know/
3.SSH tunnels指南。
https://robotmoon.com/ssh-tunnels/

编辑：至尊宝
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1192期 (2021-02-06）

1.可以将希腊文转成拉丁文的token插件

https://github.com/skroutz/elasticsearch-analysis-greeklish

2.利用grafana监控es

https://github.com/BigDataBoutique/elasticsearch-monitoring

3.spring连接es的几种方式

https://medium.com/better-programming/getting-started-with-elasticsearch-in-java-spring-boot-d981c32b60b

继续阅读 »

社区日报第1191期 (2021-02-05)

1、SpringBoot 集成 Elasticsearch 指南（梯子）
https://medium.com/better-prog ... 2b60b
2、Observability：网站 User Experience 监控
https://elasticstack.blog.csdn ... 46386
3、一周之内如何搞定 Elasticsearch，看老外怎么说？（梯子）
https://www.quora.com/I-have-b ... -week

编辑：铭毅天下
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

Observability：网站 User Experience 监控

用户体验（User Experience）提供了一种量化和分析 Web 应用程序感知性能的方法。与测试环境不同，用户体验数据反映了真实的用户体验。通过按 URL，操作系统，浏览器和位置查看数据来进一步细化 - 所有这些都会影响您的应用程序在最终用户计算机上的性能。通过用户体验监控，我们可以知道谁在使用我们的网站，他们的用户体验咋样。

详细阅读，请参阅 https://elasticstack.blog.csdn ... 46386

继续阅读 »

社区日报第1190期 (2021-02-04)

1.Elastic License v2简介
https://www.elastic.co/blog/elastic-license-v2
2.为 Elastic Security 定制 Detection rules
https://elasticstack.blog.csdn ... 84031
3.基于 Elasticsearch 的数据报表方案
https://www.jianshu.com/p/24b4ba3951eb

编辑：金桥
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第1189期 (2021-02-3)

1.2021 年 Elasticsearch 生态和技术峰会干货总结
https://mp.weixin.qq.com/s/3PihgMYpkSA-jJYFcLwrVg
2.使用 Dorothy 和 Elastic 安全测试您的 Okta 可见性和检测能力
https://www.elastic.co/cn/blog ... rothy
3.将日志数据从Jenkins传输到Kibana
https://blogs.sap.com/2019/04/ ... oard/

编辑：寂寞的烟
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

Elasticsearch：如何实现对 emoji 表情符号进行搜索

社区日报第1198期 (2021-02-27）

社区日报第1195期 (2021-02-23）

社区日报第1194期 (2021-02-22)

Enterprise：Elastic App Search - Web 爬虫

Elastic 7.11 重磅发布：可搜索快照和新冷层的正式版以及读时模式的公测版

Elasticsearch：Runtime fields 入门， Elastic 的 schema on read 实现 - 7.11 发布

Elasticsearch：使用 Runtime fields 对索引字段进行阴影处理以修复错误 - 7.11 发布

Elasticsearch：可组合的 Index templates - 7.8 版本之后

社区日报第1193期 (2021-02-07)

社区日报第1192期 (2021-02-06）

社区日报第1191期 (2021-02-05)

Observability：网站 User Experience 监控

社区日报第1190期 (2021-02-04)

社区日报第1189期 (2021-02-3)

活动推荐

热门文章

热门话题