你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
发现
分享
文章
活动
登录
要不要再翻翻文档呢?
es向量余弦相似度计算可以设置阈值吗?比如相似度大于0.8的才返回。
Elasticsearch
| 作者
Wenorm
| 发布于2020年12月17日 | 阅读数:
3683
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
文档太多,但是如果用size来限制返回数量又不合理,比如设置size=100,有可能里面只有前几个是有用的,其他都不相似,也有可能里面全是相似的,而且还漏了很多,所以觉得用size不合理。想通过相似度的阈值来筛选一下文档。
没有找到相关结果
已邀请:
与内容相关的链接
提交
1 个回复
FFFrp
赞同来自:
可以获取第一个文档的相关性打分,然后将这个打分乘以0.8,使用min_socre指定为该值重新查询
https://www.elastic.co/guide/e ... .html
要回复问题请先
登录
或
注册
发起人
Wenorm
活动推荐
Jun
17
搜索客 Meetup 讲师招募(长期有效)
线上
·
6-17 周一
·
进行中
Nov
30
【活动报名】ClickHouse Beijing User Group 第2届 Meetup
北京
·
11-30 周六
·
报名中
相关问题
怎么解决elasticsearch集群占用太多虚拟内存(VIRT)的问题?占用了几十个G,有什么可以对它进行限制的相关设置吗?
elasticsearch 设置 node.data: false 依然有数据
除了设置mapping为not analyzied,还有其他方法让一个string字段不分词吗?
如何设置分配给elasticsearch的内存大小?
elasticsearch 如何聚合后计算,聚合后的值作为计算的条件
elasticsearch使用river-jdbc导入数据库数据时怎么设置让其实时更新
我要对两个字段进行计算,然后对计算出来对新字段进行聚合
聚合查询返回的结果还未达到search.max_buckets的值,就报 超过search.max_buckets 的异常
timeout设置1ms,实际took:4ms以上响应正常数据并提示time_out:false
logstash怎么如何设置每过10分钟同步一次
es 采用match、match_phrase查询返回结果不稳定问题
问题状态
最新活动:
2020-12-20 23:43
浏览:
3683
关注:
2
人
1 个回复
FFFrp
赞同来自: