ES morelikethis. 查询出来的文档中有很多不相似的文本,请问有成功使用的朋友么?能否指点一下?

作者 luoxuefeng | 发布于2014年11月21日 | 阅读数:2464

系统提示:这个人太懒了,什么问题描述都没有写!

已邀请:

Rubricate - hi

赞同来自:

把文章贴出来看看呢。morelikethis,应该是用的空间向量模型来找最相似的,你看看那些词和词频是否相似

luoxuefeng

赞同来自:

分词器smartcn,ik,stardardAnalyzer都试了一遍
查找“By default, the queried document is excluded from the response (include set to false).”的相似文本,居然查出了
By default, the queried document is excluded from the response (include set to false).

Note: In order to use the mlt feature a mlt_field needs to be either be stored, store term_vector or source needs to be enabled.两条
其他中文的也一样,总是会查出一些完全不相似的文本

要回复问题请先登录注册