中文分词器
Elasticsearch中文分词器问题
Elasticsearch • sylvanas 回复了问题 • 12 人关注 • 4 个回复 • 6511 次浏览 • 2018-11-05 03:38
社区日报 第420期 (2018-10-17)
社区日报 • elk123 发表了文章 • 0 个评论 • 3214 次浏览 • 2018-10-17 21:31
1. ElasticSearch源码解析之启动流程
i、http://t.cn/EzUc7ox
ii、http://t.cn/EzUcOoL
2. Elasticsearch聚合优化 | 聚合速度提升5倍
http://t.cn/EzUx0rX
3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技
https://elasticsearch.cn/article/990
编辑:wt
归档:https://elasticsearch.cn/article/991
订阅:https://tinyletter.com/elastic-daily
1. ElasticSearch源码解析之启动流程
i、http://t.cn/EzUc7ox
ii、http://t.cn/EzUcOoL
2. Elasticsearch聚合优化 | 聚合速度提升5倍
http://t.cn/EzUx0rX
3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技
https://elasticsearch.cn/article/990
编辑:wt
归档:https://elasticsearch.cn/article/991
订阅:https://tinyletter.com/elastic-daily
提供一个思路供参考:
公司名称可以索引为multi-filed,即一个为keyword类型,一个为text类型。 查询的时候,使用bool Query,对两个字段分别查询后用should连接, 这样完全匹配的公司名称相关度比部分匹配的高,排在前面优先返回。... 显示全部 »
公司名称可以索引为multi-filed,即一个为keyword类型,一个为text类型。 查询的时候,使用bool Query,对两个字段分别查询后用should连接, 这样完全匹配的公司名称相关度比部分匹配的高,排在前面优先返回。... 显示全部 »
提供一个思路供参考:
公司名称可以索引为multi-filed,即一个为keyword类型,一个为text类型。 查询的时候,使用bool Query,对两个字段分别查询后用should连接, 这样完全匹配的公司名称相关度比部分匹配的高,排在前面优先返回。
例如:
[code]{
"query": {
"bool": {
"should":
}
}
}
对于常用词的滤除,一个可以考虑在分词器中,将常用词定义为stop word, 从而在分词阶段就滤除掉。 另外也可以通过boosting Query,降低这类词的打分权重。 参考: not-quite-not.html
公司名称可以索引为multi-filed,即一个为keyword类型,一个为text类型。 查询的时候,使用bool Query,对两个字段分别查询后用should连接, 这样完全匹配的公司名称相关度比部分匹配的高,排在前面优先返回。
例如:
[code]{
"query": {
"bool": {
"should":
}
}
}
对于常用词的滤除,一个可以考虑在分词器中,将常用词定义为stop word, 从而在分词阶段就滤除掉。 另外也可以通过boosting Query,降低这类词的打分权重。 参考: not-quite-not.html
Elasticsearch中文分词器问题
回复Elasticsearch • sylvanas 回复了问题 • 12 人关注 • 4 个回复 • 6511 次浏览 • 2018-11-05 03:38
社区日报 第420期 (2018-10-17)
社区日报 • elk123 发表了文章 • 0 个评论 • 3214 次浏览 • 2018-10-17 21:31
1. ElasticSearch源码解析之启动流程
i、http://t.cn/EzUc7ox
ii、http://t.cn/EzUcOoL
2. Elasticsearch聚合优化 | 聚合速度提升5倍
http://t.cn/EzUx0rX
3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技
https://elasticsearch.cn/article/990
编辑:wt
归档:https://elasticsearch.cn/article/991
订阅:https://tinyletter.com/elastic-daily
1. ElasticSearch源码解析之启动流程
i、http://t.cn/EzUc7ox
ii、http://t.cn/EzUcOoL
2. Elasticsearch聚合优化 | 聚合速度提升5倍
http://t.cn/EzUx0rX
3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技
https://elasticsearch.cn/article/990
编辑:wt
归档:https://elasticsearch.cn/article/991
订阅:https://tinyletter.com/elastic-daily