愚者求师之过,智者从师之长。

社区日报 第1237期 (2021-04-16)

1、SQLServer 连接Elasticsearch 的两种方式
https://hevodata.com/learn/ela ... rver/
 
2、如何制作 GeoJSON 文件并进行地理位置搜索?
https://elasticstack.blog.csdn ... 27243
 
3、Elasticsearch+kibana集成实例
https://blog.galenhealthcare.c ... tion/
 
 

编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

继续阅读 »
1、SQLServer 连接Elasticsearch 的两种方式
https://hevodata.com/learn/ela ... rver/
 
2、如何制作 GeoJSON 文件并进行地理位置搜索?
https://elasticstack.blog.csdn ... 27243
 
3、Elasticsearch+kibana集成实例
https://blog.galenhealthcare.c ... tion/
 
 

编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

收起阅读 »

社区日报 第1236期 (2021-04-15)

1.elastic apm入选gartner
https://www.elastic.co/blog/el ... oring
2.Kibana:运用 script fields 对数据进行清洗
https://elasticstack.blog.csdn ... 15431
3.基于 ELK 天气指标监控在线实时监控案例
https://blog.csdn.net/u0142965 ... 29424

编辑:金桥
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1.elastic apm入选gartner
https://www.elastic.co/blog/el ... oring
2.Kibana:运用 script fields 对数据进行清洗
https://elasticstack.blog.csdn ... 15431
3.基于 ELK 天气指标监控在线实时监控案例
https://blog.csdn.net/u0142965 ... 29424

编辑:金桥
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

Elasticsearch:Script fields 及其调试

在搜索时,每个 _search 请求的匹配(hit)可以使用 script_fields (基于不同的字段)定制一些属性。这些定制的属性(script fields)通常是:

针对原有值的修改(比如,价钱的转换,不同的排序方法等)
一个崭新的及算出来的属性(比如,总和,加权,指数运算,距离测量等)

原文链接:https://blog.csdn.net/UbuntuTo ... 92778
继续阅读 »
在搜索时,每个 _search 请求的匹配(hit)可以使用 script_fields (基于不同的字段)定制一些属性。这些定制的属性(script fields)通常是:

针对原有值的修改(比如,价钱的转换,不同的排序方法等)
一个崭新的及算出来的属性(比如,总和,加权,指数运算,距离测量等)

原文链接:https://blog.csdn.net/UbuntuTo ... 92778 收起阅读 »

如何使用 Elasticsearch 和 Python 构建面部识别系统

你是否曾经尝试在图像中搜索对象? Elasticsearch 可以帮助你存储,分析和搜索图像或视频中的对象。

在本快速教程中,我们将向你展示如何构建一个使用 Python 进行面部识别的系统。 了解有关如何检测和编码面部信息的更多信息-并在搜索中找到匹配项。



在今天的练习中,我们将参照代码:https://github.com/liu-xiao-gu ... earch。你可以把这个代码下载到本地的电脑:

原文链接:https://blog.csdn.net/UbuntuTo ... 27926
继续阅读 »
你是否曾经尝试在图像中搜索对象? Elasticsearch 可以帮助你存储,分析和搜索图像或视频中的对象。

在本快速教程中,我们将向你展示如何构建一个使用 Python 进行面部识别的系统。 了解有关如何检测和编码面部信息的更多信息-并在搜索中找到匹配项。



在今天的练习中,我们将参照代码:https://github.com/liu-xiao-gu ... earch。你可以把这个代码下载到本地的电脑:

原文链接:https://blog.csdn.net/UbuntuTo ... 27926 收起阅读 »

社区日报 第1235期 (2021-04-12)

1. 关于elasticsearch 的6件不太明显的事情
https://blog.csdn.net/weixin_4 ... 44331

2.从诗词大会飞花令到elasticsearch原理解析
https://mp.weixin.qq.com/s/LD2VG6dRNYXOO9KE38F_Mg

3.温故而知新,来了解下elasticsearch 的发展史吧(截止7.0)
https://www.cnblogs.com/wangzh ... .html

编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1. 关于elasticsearch 的6件不太明显的事情
https://blog.csdn.net/weixin_4 ... 44331

2.从诗词大会飞花令到elasticsearch原理解析
https://mp.weixin.qq.com/s/LD2VG6dRNYXOO9KE38F_Mg

3.温故而知新,来了解下elasticsearch 的发展史吧(截止7.0)
https://www.cnblogs.com/wangzh ... .html

编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1234期 (2021-4-11)

1.(自备梯子)Lyft的Elasticsearch优化。 
https://eng.lyft.com/elasticse ... 20932 
2.如何为生产建立Elastic搜索集群? 
https://www.cncf.io/blog/2021/ ... tion/ 
3.我如何将GTA Online的加载时间减少70%。 
https://nee.lv/2021/02/28/How- ... y-70/

编辑:至尊宝
归档:https://ela.st/cn-daily-all 
订阅:https://ela.st/cn-daily-sub 
沙龙:https://ela.st/cn-meetup
继续阅读 »
1.(自备梯子)Lyft的Elasticsearch优化。 
https://eng.lyft.com/elasticse ... 20932 
2.如何为生产建立Elastic搜索集群? 
https://www.cncf.io/blog/2021/ ... tion/ 
3.我如何将GTA Online的加载时间减少70%。 
https://nee.lv/2021/02/28/How- ... y-70/

编辑:至尊宝
归档:https://ela.st/cn-daily-all 
订阅:https://ela.st/cn-daily-sub 
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1232期 (2021-04-09)

1、Elasticsearch 和 Kafka 强强联合、无缝衔接
https://www.elastic.co/cn/blog ... ience
2、基于EFK的日志场景实践
https://blog.dream11engineerin ... 13cd5
3、Kibana 部署视频详解(梯子)
https://www.youtube.com/watch?v=kqCd2mVQE54
 
编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1、Elasticsearch 和 Kafka 强强联合、无缝衔接
https://www.elastic.co/cn/blog ... ience
2、基于EFK的日志场景实践
https://blog.dream11engineerin ... 13cd5
3、Kibana 部署视频详解(梯子)
https://www.youtube.com/watch?v=kqCd2mVQE54
 
编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1231期 (2021-04-08)

1. 如何使用 Elastic 可观测性来监测 NVIDIA GPU 指标
https://www.elastic.co/cn/blog ... ility
2.设置Elasticsearch集群(梯子)
https://medium.com/grafana-tut ... 16cb4
3.集中式日志 EFK — Helm (Elasticsearch, Fluentd, Kibana)(梯子)
https://rajprataprps.medium.co ... d79f2

编辑:寂寞的烟
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
 
继续阅读 »
1. 如何使用 Elastic 可观测性来监测 NVIDIA GPU 指标
https://www.elastic.co/cn/blog ... ility
2.设置Elasticsearch集群(梯子)
https://medium.com/grafana-tut ... 16cb4
3.集中式日志 EFK — Helm (Elasticsearch, Fluentd, Kibana)(梯子)
https://rajprataprps.medium.co ... d79f2

编辑:寂寞的烟
归档:https://ela.st/cn-daily-all
订阅https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
  收起阅读 »

Elasticsearch 实现模糊查询效果方式对比


下面是ES做传统意义上的模糊查询的两种方式,我们分析下优劣势
1:将字段设置为keyword类型,使用wildcard实现模糊查询,如果数据量较大,这种方式模糊查询效率是非常低的,所以实际案例中其实是不太实用的,除非你的数据量只有几十万,完全不用考虑效率问题,而且ES限制单个词条不能超过32766个字节,那么超过10000多字符的文章是不能被全部索引到的,那么模糊查询时就查不到没有索引到的关键词。

2:实用match_phrase查询,设置slop为0,配合单字分词实现模糊查询效果。
第二种方式最关键的是我们要实现单字符的分词,通常很多人认为标准分词器就是单字分词,事实上stander分词器只能对中文实现单字分词,对英文与数字是不能单字符分词的,而且本身就是忽略标点符号的,这样的话用match_phrase实现模糊查询其实就有误差了,例如 “中国最美,丽江盛景”,这个时候我们搜索“美丽”也一样能搜到,因为他本身忽略了标点符号,或者搜索数字或者字母时也一样没有办法跟传统的模糊查询保持一致。

所以经过测试,推荐使用ngram自定义配置实现单字分词效果,分析器配置入下
"analysis": {
"analyzer": {
"charSplit": {
"type": "custom",
"tokenizer": "my_ngram_tokenizer",
"filter": [
"lowercase"
],
"char_filter": [
"html_strip"
]
}
},
"tokenizer": {
"my_ngram_tokenizer": {
"type": "nGram",
"min_gram": "1",
"max_gram": "1",
"token_chars": [
"letter",
"digit",
"punctuation"
]
}
}
}
这样我们可以把所有的字符都单字分词,然后配合match_phrase就能实现一个真正意义上的模糊查询,这种搜索效率是比wildcard要高出很多。

上面两种方式都可以实现模糊查询的效果,第一种方式缺点就是效率太低,而且字段长度太大没有办法全部索引到。再看下第二种方式的问题

1.使用ngram单字分词会导致索引量增加(测试发现基本会翻倍甚至更多),相应的分片数与硬件配置要求需要增加。

2.使用单字符分词会使同义词查询失效,甚至影响相似性查询等操作,当然,一般来说要模糊查询也就不会考虑同义词查询了。

3.继承了传统模糊查询的问题,如搜索“8年抗战”相关内容,直接搜索关键词“8年”,会搜索到包含“2018年”的内容,这样显然不是你要的结果,但是模糊查询就是这样的效果。

4.field_data也是基于倒排索引实现功能,如有聚合或者排序等操作,也会使用单字符效果,如:某字段存储汉字“中国”,“美国”,但类型为text,这个时候如果要按照国家来聚合查询数据,单字段分词结果就会不准确,就是说聚合与排序也会用单字分词后的索引去做聚合与排序,结果自然也就有偏差了.

以上就是两种模糊查询的方式对比,实际环境里还是需要按照实际的需求与环境决定怎样选择,各位大神如果有更好的方式欢迎交流分享!

继续阅读 »

下面是ES做传统意义上的模糊查询的两种方式,我们分析下优劣势
1:将字段设置为keyword类型,使用wildcard实现模糊查询,如果数据量较大,这种方式模糊查询效率是非常低的,所以实际案例中其实是不太实用的,除非你的数据量只有几十万,完全不用考虑效率问题,而且ES限制单个词条不能超过32766个字节,那么超过10000多字符的文章是不能被全部索引到的,那么模糊查询时就查不到没有索引到的关键词。

2:实用match_phrase查询,设置slop为0,配合单字分词实现模糊查询效果。
第二种方式最关键的是我们要实现单字符的分词,通常很多人认为标准分词器就是单字分词,事实上stander分词器只能对中文实现单字分词,对英文与数字是不能单字符分词的,而且本身就是忽略标点符号的,这样的话用match_phrase实现模糊查询其实就有误差了,例如 “中国最美,丽江盛景”,这个时候我们搜索“美丽”也一样能搜到,因为他本身忽略了标点符号,或者搜索数字或者字母时也一样没有办法跟传统的模糊查询保持一致。

所以经过测试,推荐使用ngram自定义配置实现单字分词效果,分析器配置入下
"analysis": {
"analyzer": {
"charSplit": {
"type": "custom",
"tokenizer": "my_ngram_tokenizer",
"filter": [
"lowercase"
],
"char_filter": [
"html_strip"
]
}
},
"tokenizer": {
"my_ngram_tokenizer": {
"type": "nGram",
"min_gram": "1",
"max_gram": "1",
"token_chars": [
"letter",
"digit",
"punctuation"
]
}
}
}
这样我们可以把所有的字符都单字分词,然后配合match_phrase就能实现一个真正意义上的模糊查询,这种搜索效率是比wildcard要高出很多。

上面两种方式都可以实现模糊查询的效果,第一种方式缺点就是效率太低,而且字段长度太大没有办法全部索引到。再看下第二种方式的问题

1.使用ngram单字分词会导致索引量增加(测试发现基本会翻倍甚至更多),相应的分片数与硬件配置要求需要增加。

2.使用单字符分词会使同义词查询失效,甚至影响相似性查询等操作,当然,一般来说要模糊查询也就不会考虑同义词查询了。

3.继承了传统模糊查询的问题,如搜索“8年抗战”相关内容,直接搜索关键词“8年”,会搜索到包含“2018年”的内容,这样显然不是你要的结果,但是模糊查询就是这样的效果。

4.field_data也是基于倒排索引实现功能,如有聚合或者排序等操作,也会使用单字符效果,如:某字段存储汉字“中国”,“美国”,但类型为text,这个时候如果要按照国家来聚合查询数据,单字段分词结果就会不准确,就是说聚合与排序也会用单字分词后的索引去做聚合与排序,结果自然也就有偏差了.

以上就是两种模糊查询的方式对比,实际环境里还是需要按照实际的需求与环境决定怎样选择,各位大神如果有更好的方式欢迎交流分享!

收起阅读 »

社区日报 第1229期 (2021-04-01)

1.Lucene高性能索引之道
https://mp.weixin.qq.com/s/_k-toltGmSBIl8zPq93jPQ
2.Flink 实时写入数据到 ElasticSearch 性能调优
https://mp.weixin.qq.com/s/bJ85tTSIHSpUIk-jPo0wxw
3.使用Beats创建ES template及Dashboard
https://elasticstack.blog.csdn ... 41977

编辑:金桥
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1.Lucene高性能索引之道
https://mp.weixin.qq.com/s/_k-toltGmSBIl8zPq93jPQ
2.Flink 实时写入数据到 ElasticSearch 性能调优
https://mp.weixin.qq.com/s/bJ85tTSIHSpUIk-jPo0wxw
3.使用Beats创建ES template及Dashboard
https://elasticstack.blog.csdn ... 41977

编辑:金桥
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1228期 (2021-03-29)

1.elk 性能优化实践。
http://t.cn/A6cz6pfL


2.elasticsearch 索引 对比 mysql 索引
http://t.cn/A6cz6jTn


3.Elasticsearch线程池概览
https://opster.com/elasticsear ... pool/


编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

 
继续阅读 »
1.elk 性能优化实践。
http://t.cn/A6cz6pfL


2.elasticsearch 索引 对比 mysql 索引
http://t.cn/A6cz6jTn


3.Elasticsearch线程池概览
https://opster.com/elasticsear ... pool/


编辑:cyberdak
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

  收起阅读 »

社区日报 第1226期 (2021-3-28)

1.我们如何阻止内存密集型查询使ElasticSearch崩溃 
https://plaid.com/blog/how-we- ... arch/ 
2.每秒在Elasticsearch中存储5000万个事件。 
https://datadome.co/bot-detect ... arch/ 
3.为什么英语实际上相对容易学习(但很难完全掌握)。 
http://christopherwink.com/201 ... ngue/

编辑:至尊宝
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1.我们如何阻止内存密集型查询使ElasticSearch崩溃 
https://plaid.com/blog/how-we- ... arch/ 
2.每秒在Elasticsearch中存储5000万个事件。 
https://datadome.co/bot-detect ... arch/ 
3.为什么英语实际上相对容易学习(但很难完全掌握)。 
http://christopherwink.com/201 ... ngue/

编辑:至尊宝
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »

社区日报 第1224期 (2021-03-26)

1、开源与云Elasticsearch应用剖析
https://developer.aliyun.com/article/783026
2、Elasticsearch集群部署和备份指南
https://www.twilio.com/blog/se ... ackup
3、Elasticsearch Neo4j 图谱实践指南
https://dzone.com/articles/kno ... -neo4
 
编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup
继续阅读 »
1、开源与云Elasticsearch应用剖析
https://developer.aliyun.com/article/783026
2、Elasticsearch集群部署和备份指南
https://www.twilio.com/blog/se ... ackup
3、Elasticsearch Neo4j 图谱实践指南
https://dzone.com/articles/kno ... -neo4
 
编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup 收起阅读 »