使用 shuf 来打乱一个文件中的行或是选择文件中一个随机的行。
中文分词器

中文分词器

Elasticsearch中文分词器问题

Elasticsearchsylvanas 回复了问题 • 12 人关注 • 4 个回复 • 6435 次浏览 • 2018-11-05 03:38 • 来自相关话题

社区日报 第420期 (2018-10-17)

社区日报elk123 发表了文章 • 0 个评论 • 3175 次浏览 • 2018-10-17 21:31 • 来自相关话题

1. ElasticSearch源码解析之启动流程 i、http://t.cn/EzUc7ox ii、http://t.cn/EzUcOoL 2. Elasticsearch聚合优化 | 聚合速度提升5倍 http://t.cn/EzUx0rX 3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技 https://elasticsearch.cn/article/990 编辑:wt 归档:https://elasticsearch.cn/article/991 订阅:https://tinyletter.com/elastic-daily
1. ElasticSearch源码解析之启动流程 i、http://t.cn/EzUc7ox ii、http://t.cn/EzUcOoL 2. Elasticsearch聚合优化 | 聚合速度提升5倍 http://t.cn/EzUx0rX 3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技 https://elasticsearch.cn/article/990 编辑:wt 归档:https://elasticsearch.cn/article/991 订阅:https://tinyletter.com/elastic-daily
条新动态, 点击查看
kennywu76

kennywu76 回答了问题 • 2018-11-01 10:10 • 4 个回复 不感兴趣

Elasticsearch中文分词器问题

赞同来自:

提供一个思路供参考:
 
公司名称可以索引为multi-filed,即一个为keyword类型,一个为text类型。 查询的时候,使用bool Query,对两个字段分别查询后用should连接, 这样完全匹配的公司名称相关度比部分匹配的高,排在前面优先返回。... 显示全部 »
提供一个思路供参考:
 
公司名称可以索引为multi-filed,即一个为keyword类型,一个为text类型。 查询的时候,使用bool Query,对两个字段分别查询后用should连接, 这样完全匹配的公司名称相关度比部分匹配的高,排在前面优先返回。
 
例如:
[code]{
"query": {
"bool": {
"should":
}
}
}
对于常用词的滤除,一个可以考虑在分词器中,将常用词定义为stop word, 从而在分词阶段就滤除掉。 另外也可以通过boosting Query,降低这类词的打分权重。 参考:  not-quite-not.html

Elasticsearch中文分词器问题

回复

Elasticsearchsylvanas 回复了问题 • 12 人关注 • 4 个回复 • 6435 次浏览 • 2018-11-05 03:38 • 来自相关话题

社区日报 第420期 (2018-10-17)

社区日报elk123 发表了文章 • 0 个评论 • 3175 次浏览 • 2018-10-17 21:31 • 来自相关话题

1. ElasticSearch源码解析之启动流程 i、http://t.cn/EzUc7ox ii、http://t.cn/EzUcOoL 2. Elasticsearch聚合优化 | 聚合速度提升5倍 http://t.cn/EzUx0rX 3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技 https://elasticsearch.cn/article/990 编辑:wt 归档:https://elasticsearch.cn/article/991 订阅:https://tinyletter.com/elastic-daily
1. ElasticSearch源码解析之启动流程 i、http://t.cn/EzUc7ox ii、http://t.cn/EzUcOoL 2. Elasticsearch聚合优化 | 聚合速度提升5倍 http://t.cn/EzUx0rX 3. Elastic 社区电台 第五期,嘉宾:李啸、张振风@趋势科技 https://elasticsearch.cn/article/990 编辑:wt 归档:https://elasticsearch.cn/article/991 订阅:https://tinyletter.com/elastic-daily