你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
没有找到相关结果
rochy - rochy_he
赞同来自:
novia - 1&0
laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net
zqc0512 - andy zhou
qqq1234567
core_wzw - 某AILab搜索技术负责人
skymilong66
要回复问题请先登录或注册
7 个回复
rochy - rochy_he
赞同来自:
你现在的需求就造成无法定义相似度高,
此外相似度高的显示那一条数据呢?
你这个最好是使用 ES 查询,然后自己程序里面进行判断
相似度你可以使用 编辑距离、余弦距离等方式来进行判定。
novia - 1&0
赞同来自:
laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net
赞同来自:
zqc0512 - andy zhou
赞同来自:
qqq1234567
赞同来自:
core_wzw - 某AILab搜索技术负责人
赞同来自:
业务层面必然会碰到的问题,我的经验是文档入库前spark算文档的simhash,建立一个冗余库,业务文档索引库只存在一篇“原创”文档,通过UI端提供相似文档按钮召回冗余库里的相似文档即可。
skymilong66
赞同来自: