要不要再翻翻文档呢?

es向量余弦相似度计算可以设置阈值吗?比如相似度大于0.8的才返回。

Elasticsearch | 作者 Wenorm | 发布于2020年12月17日 | 阅读数:3683

文档太多,但是如果用size来限制返回数量又不合理,比如设置size=100,有可能里面只有前几个是有用的,其他都不相似,也有可能里面全是相似的,而且还漏了很多,所以觉得用size不合理。想通过相似度的阈值来筛选一下文档。
已邀请:

FFFrp

赞同来自:

可以获取第一个文档的相关性打分,然后将这个打分乘以0.8,使用min_socre指定为该值重新查询https://www.elastic.co/guide/e ... .html

要回复问题请先登录注册