Q:有两个人掉到陷阱里了,死的人叫死人,活人叫什么?

关于suggest

Elasticsearch | 作者 zplzpl | 发布于2016年06月17日 | 阅读数:4508

suggest能是根据分析器自动生成的吗?
而不是靠人工去输入input[]这个数组
已邀请:

medcl - 今晚打老虎。

赞同来自:

你的数据源在哪里呢?自动生成的能保证准确么?如果可以,那自然是可以的,你在mapping里配置对应字段为suggest类型就行了。

hapjin

赞同来自:

看起来不同的场景使用 sug 的方式不一样,web搜索引擎和电商搜索sug要求是不一样的。比如电商搜索sug不仅要求出sug词,还要求出相应的属性标签(比如:牛奶 250g)
 
 一、候选 sug 词数据来源:
商品侧:query 召回的商品数、query 召回的订单数
query侧:QV、QV_CTR、QV_CXR
从这两个角度选出的 query 作为 sug 词候选集

二、数据处理(分析)
规则挖掘、FP算法挖掘、商品标题NER标签提取:功效/品牌/适用群体/适用场景+简名

三、sug 词召回
query:商品侧 vs query侧
query处理:原始query(未处理) vs 改写query
原始query/改写query-->分词-->基于分词结果从候选集中进行前缀召回
原始query/改写query-->拼音前缀匹配召回
原始query/改写query-->连续子串匹配召回

四、排序
query 侧召回的词 > 商品侧召回的词
搜索PV
固定指标:QV_CTR/QV_CXR

五、评价指标
sug 词点击率
搜索框跳出率
转化指标等

六、工程技术方案
https://github.com/hankcs/AhoC ... yTrie 双数组字典树,key 是查询词,value 支持对象(sug结果词+各种指标(搜索 uv、QV_CTR、QV_CXR))。所以 ES 的 suggester 可以当做其中的一路召回吧,但是要注意性能问题。

要回复问题请先登录注册