你可以的,加油

求助一下ES里重复数据怎么清楚

Elasticsearch | 作者 ws853055677 | 发布于2020年09月09日 | 阅读数:3206

在做导入的时候导入重复了,现在根据‘商品id’和'来源'两个字段能确定出来重复的数据。但是怎么清楚掉不知道怎么办,求助大佬。
 

POST search_product/_search
{
  
  "size": 0,
  "aggs": {
    "duplicateCount": {
      "terms":{
      "script": "doc['productFromType.keyword'].value + '#' + doc['shopProductId'].value + '#' ",
     "min_doc_count": 2
    },

      "aggs": {
        "duplicateDocuments": {
          "top_hits": {}
        }
      }
    }
  }
}
 
11112.png
已邀请:

AiToMaKoTo - Elasticsearch.永远滴神

赞同来自:

找出重复的数据,根据这些数据找出存入es的_id,然后再根据_id删除重复的数据

要回复问题请先登录注册