如何查询某一个词的词频

作者 tsyj211 | 发布于2018年07月09日 | 阅读数:211

例如我想查询“丰田汽车”这个词在ES某个字段里出现的频率,怎么查询啊?各位高手
已邀请:

yangfeifei123

赞同来自:

你先使用termquery查出有丰田汽车这个词的条数,你一共有多少数据也可以查出来,就可以知道这个词出现频率。你觉得这个方案如何

YouSheng

赞同来自:

题主的意思是词频,通过查询_termvectors这个查询到。
但是首先要确保“丰田汽车”这个词没有被分词。

yangfeifei123

赞同来自:

tremquery就是保证“丰田汽车”不会被分词,兄得

YouSheng

赞同来自:

索引的时候分词怎么办?

yangfeifei123

赞同来自:

索引得时候可以设置某个具体的分词器,可以设置不分词,根据你的需求设置

YouSheng

赞同来自:

是的,如果索引的时候“丰田汽车”已经被分词了,在termquery用“丰田汽车”是查不到的吧?

yangfeifei123

赞同来自:

那要看你的分词器是怎么分的,就比如丰田汽车就可能分成:丰田,汽车,丰田汽车三个词,这样还是可以查到的。

laoyang360 - [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:blog.csdn.net/laoyang360

赞同来自:

https://blog.csdn.net/laoyang3 ... 03996
Elasticsearch词频统计实现与原理解读

要回复问题请先登录注册