你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
没有找到相关结果
medcl - 今晚打老虎。
赞同来自:
hapjin
要回复问题请先登录或注册
2 个回复
medcl - 今晚打老虎。
赞同来自:
hapjin
赞同来自:
一、候选 sug 词数据来源:
商品侧:query 召回的商品数、query 召回的订单数
query侧:QV、QV_CTR、QV_CXR
从这两个角度选出的 query 作为 sug 词候选集
二、数据处理(分析)
规则挖掘、FP算法挖掘、商品标题NER标签提取:功效/品牌/适用群体/适用场景+简名
三、sug 词召回
query:商品侧 vs query侧
query处理:原始query(未处理) vs 改写query
原始query/改写query-->分词-->基于分词结果从候选集中进行前缀召回
原始query/改写query-->拼音前缀匹配召回
原始query/改写query-->连续子串匹配召回
四、排序
query 侧召回的词 > 商品侧召回的词
搜索PV
固定指标:QV_CTR/QV_CXR
五、评价指标
sug 词点击率
搜索框跳出率
转化指标等
六、工程技术方案
https://github.com/hankcs/AhoC ... yTrie 双数组字典树,key 是查询词,value 支持对象(sug结果词+各种指标(搜索 uv、QV_CTR、QV_CXR))。所以 ES 的 suggester 可以当做其中的一路召回吧,但是要注意性能问题。