找到问题的解决办法了么?

ES查询返回结果优化

Elasticsearch | 作者 hu_sunshine | 发布于2021年04月27日 | 阅读数:2261

一、问题
业务要求,需要将3W左右的数据,拿去和ES中的200w的数据,根据客户名称进行精确匹配,返回匹配成功的原数据,特点:ES中的数据,存在大量重复,导致返回结果可能大于pageSize,以及存在重复.既影响返回效果,查询效率也很低
二、疑问
1.是否可以在使用ES进行搜索时,返回值自动去重
2.是否可以当A在ES中找到一条存在的,则跳过A的匹配,直接进行B的匹配
三、目的
1.优化返回结果
2.提高查询效率
===========求助大神,能够给予帮助============
已邀请:

Memento - Memento

赞同来自:

1. 返回结果大于 pageSize的话, 可以分批并行匹配处理;
2. 去重的话可以用keyword字段类型进行聚合;
3. 每个聚合里取top1即可;

要回复问题请先登录注册