1.ES之从零开始 | 搜索建议 - 简介
Elasticsearch • Ricky_Lau 发表了文章 • 0 个评论 • 4076 次浏览 • 2020-07-22 18:59
1.ES之从零开始 | 搜索建议 - 简介
自从个人博客数据意外丢失后,已经有一年没写过博客了。
觉得地下有点凉,是时候爬起来了,所以就有了这个系列的分享。
为什么要用搜索建议 ?
通过两个小例子,了解搜索建议主要功能:纠错(Did You Mean)和补全(Auto-complete).
- 手残党,有些时间在输入比较长的英文单词的时候总会有缺胳膊少腿的问题,是否可以通过技术来解决这类问题提升用户的体验?
![](http://elasticsearch.club/wp-c ... 01.jpg)
![](http://elasticsearch.club/wp-c ... 02.png)- 公司里业务开发对Elasticsearch的query DSL 不是特别熟悉,若是纯手写,基本是无法完成正确查询语法的编写
,但如果使用kibna却是可以写出正确的查询的。
![](http://elasticsearch.club/wp-c ... 03.png)
![](http://elasticsearch.club/wp-c ... 04.png)
![](http://elasticsearch.club/wp-c ... 05.png)
![](http://elasticsearch.club/wp-c ... 06.png)
![](http://elasticsearch.club/wp-c ... 07.png)
相信通过上面两个例子,都了解了搜索建议的两个主要功能纠错和补全,为什么要使用也就迎刃而解了。
接下来,主要从技术和落地的维度来聊一聊搜索建议。
搜索建议的技术架构
- 纠错(Did You Mean)
![](http://elasticsearch.club/wp-c ... 09.png)- 用户在搜索框中输入有问题的词,elastisearch(少了个字母c )
- 由于少了个字母,倒排表里未找到相应的文档,所以返回的命中结果为0.
- 因为命中0结果,发送一个纠错请求,希望通过增加、删除、替换一个字符来取得一个系统里存在的词。
- 把纠错后的词发送到客户端
- 获取系统中存在的,最可能的纠错词。
- 选择正确的纠错词发送查询请求
- 返回希望的检索结果。
- 补全(Auto-Complete)
![](http://elasticsearch.club/wp-c ... 08.png)- 用户输入第一个字符
- 异步发送第一个字符尝试进行前缀补全
- 返回前缀被全词, 相同前缀的根据权重排序返回
- 选择下拉正确的补全词
- 根据正确的词,发送检索请求
- 返回期望的查询结果。
小结
- 纠错可以解决小范围输错的问题,增加容错率来提升用户体验。
- 补全,可以有效的减少用户输入,提升搜索的准确率。
es里的document的"_id"和org.apache.lucene.search.ScoreDoc.doc是什么关系
Lucene • Charele 回复了问题 • 3 人关注 • 2 个回复 • 2849 次浏览 • 2020-07-22 15:47
lucene 或者 es中不存储原字段的应用场景是什么呢???
Lucene • Charele 回复了问题 • 3 人关注 • 2 个回复 • 2385 次浏览 • 2020-07-22 15:32
es索引查询结果不一致,每次查询结果在返回1条和返回5条间进行切换
Elasticsearch • heli 回复了问题 • 3 人关注 • 1 个回复 • 2976 次浏览 • 2020-07-22 11:17
logstash吞吐量太低了怎么优化呢?
Logstash • Fent 回复了问题 • 6 人关注 • 4 个回复 • 7167 次浏览 • 2020-07-22 08:20
社区日报 第1005期 (2020-07-21)
社区日报 • kimichen123 发表了文章 • 0 个评论 • 834 次浏览 • 2020-07-22 00:58
http://tinyurl.com/yxvu9f2p
2、 在GCP中使用Terraform自动部署Elasticsearch。
http://tinyurl.com/y5r4nunw
3、剖析 Elasticsearch 源码,解读 ES 在 index、create 时的原理。
http://tinyurl.com/y4zzfddv
编辑:叮咚光军
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
Kibana:运用索引模式的 formatter 来探索 IP 信息
回复Kibana • liuxg 发起了问题 • 1 人关注 • 0 个回复 • 2407 次浏览 • 2020-07-21 12:25
shards数量不均衡问题
Elasticsearch • laoyang360 回复了问题 • 6 人关注 • 5 个回复 • 1666 次浏览 • 2020-07-21 09:26
es查询报错circuit_breaking_exception","reason":"[parent] Data too large,异常
Elasticsearch • pony_maggie 回复了问题 • 3 人关注 • 2 个回复 • 9529 次浏览 • 2020-07-21 08:49
Elasticsearch6.0.0 for win2012服务器坏了,更换新服务器后,数据没有同步回来
Elasticsearch • hackerwin7 回复了问题 • 2 人关注 • 2 个回复 • 1034 次浏览 • 2020-07-20 18:39
社区日报 第1004期 (2020-07-20)
社区日报 • cyberdak 发表了文章 • 0 个评论 • 1022 次浏览 • 2020-07-20 14:23
http://t.cn/A6yE5Hp3
2.从400+节点ElasticSearch集群的运维中,我们总结了这些经验
http://t.cn/A6yEcALs
3.帮你踩过的坑,你可以直接来学习
http://t.cn/A6yEcRDJ
编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
社区日报 第1003期 (2020-07-19)
社区日报 • elk123 发表了文章 • 0 个评论 • 1012 次浏览 • 2020-07-20 13:23
http://tinyurl.com/yycn3fag
2. 异步的python ES客户端
http://tinyurl.com/yy6xyucu
3. 58同城Elasticsearch应用及平台建设实践
http://tinyurl.com/yymraqrv
编辑:wt
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
elasticsearch autogenerating ids是在哪个阶段生成的?
Elasticsearch • Charele 回复了问题 • 2 人关注 • 1 个回复 • 1373 次浏览 • 2020-07-20 11:36