三人行必有我师

Elasticsearch动态计算每条数据关键词出现次数,并按照公式计算后根据计算结果排序

Elasticsearch | 作者 ZhangXu | 发布于2021年01月08日 | 阅读数:105

SS=0.3*IFNorm. + 0.4*[(0.6*K-NAMENorm.+0.4*K-ABSTRACTNorm.)平均]平均
+ 0.3*(0.6*CA-NAMENorm.+0.4*CA-ABSTRACTNorm.)平均


其中:
IFNorm.,期刊影响因子(归一化),目前以0-3为界限,超3按照3处理
K-NAMENorm.,标题名称中是否包含关键词(以及该关键词包含的关联词),包含为1,不包含为0
K-ABSTRACTNorm.,摘要中关键词(以及该关键词包含的关联词)出现频次,目前以0-10为界限,超10按照10处理
CA-NAMENorm.,标题名称中是否包含分类词(以添加的最终关键词为准),包含为1,不包含为0
CA-ABSTRACTNorm.,摘要中分类词出现频次,目前以0-10为界限,超10按照10处理


规则:
①关键词之间是并列关系;关键词需同时满足;
②分类词之间是或者关系

示例:
关键词 深层 碳酸盐岩 。。。
关联词 高温高压,奥陶系 白云岩、灰岩 。。。
分类词 理论+原理+模型 。。。
实验 。。。
试验、实践、应用效果、现场 。。。
算法步骤:
①基于【深层】检索标题和摘要是否包含,从而判定系数,然后用【深层】的关联词,分别判断运行一次,即:运行【深层】、【高温高压】、【奥陶系】分别在检索标题和摘要是否包含,从而判定系数,取三次运算的平均
②判断符合关键词【深层】的结果,进行【碳酸盐岩】、【白云岩】、【灰岩】的标题和摘要是否包含判断,取三次运算的平均
③基于【理论】、【原理】、【模型】检索标题和摘要是否包含,从而判定系数,取运算结果平均
④基于【实验】检索标题和摘要是否包含,从而判定系数
⑤基于【试验】、【实践】、【应用效果】、【现场】检索标题和摘要是否包含,从而判定系数
⑥将上述计算结果带入公式,取①和②的平均值
已邀请:

要回复问题请先登录注册