用了Elasticsearch,一口气上5T
Filter Aggregation

Filter Aggregation

关于sum bucket 与Filter Aggregation 结合的写法分享

Elasticsearchcq1988114 发表了文章 • 0 个评论 • 3009 次浏览 • 2019-09-19 00:14 • 来自相关话题

我们可以用ES的桶来实现这样的需求,找出汽车厂商每个颜色的车辆数量 当如果需求是,找出汽车厂商里的车一共有多少种颜色呢?  我们可以使用sum bucket ,默认情况下,可以参考官方文档 https://www.elastic.co/guide/e ... ml%23   但如果我们想找到售价大于100W的车,有多少种颜色呢? 这就需要Filter Aggregation   和 上文的sum bucket结合   这里有个需要注意的地方,sum_bucket的位置不要跟 Filter Aggregation 同级,而是应该在其下一级:
    "query": {
        "query": {
            "bool": {
                "filter": {
                    "bool": {
                        "must": [
                            {
                                "term": {
                                    "delflag": 0
                                }
                            },
                            {
                                "term": {
                                    "is_child": 1
                                }
                            }
                        ],
                        "must_not": 
                    }
                }
            }
        },
        "aggs": {
            "valid_sales_people": {
                "filter": {
                    "bool": {
                        "must_not": {
                            "terms": {
                                "status": [
                                    0,
                                    1,
                                    7
                                ]
                            }
                        }
                    }
                },
                "aggs": {
                    "render_people": {
                        "terms": {
                            "field": "uid",
                            "size": 2147483647
                        },
                        "aggs": {
                            "unique_people": {
                                "cardinality": {
                                    "field": "uid"
                                }
                            }
                        }
                    },
                    "member_count": {
                        "sum_bucket": {
                            "buckets_path": "render_people>unique_people" 
                        }
                    }
                }
            }
        }
    },
如代码所示,我希望对status not in (0,1,7)的uid(用户)进行聚合,并想得到uid桶种类的求和,那么member_count就应该与render_people同级,而不是把member_count放到和与valid_sales_people同一级。   如果将member_count 与valid_sales_people放到同一级,会报一个错:sum_bucket的第一个聚合必须是多桶聚合。究其原因,应该是加上filter aggregation后,valid_sales_people已不具有多桶聚合属性(因为附带了filter过滤条件),而其下的render_people则具有了多桶聚合属性。所以member_count应该与render_people放在同级,对应的buckets_path也自然改为render_people>unique_people    

关于sum bucket 与Filter Aggregation 结合的写法分享

Elasticsearchcq1988114 发表了文章 • 0 个评论 • 3009 次浏览 • 2019-09-19 00:14 • 来自相关话题

我们可以用ES的桶来实现这样的需求,找出汽车厂商每个颜色的车辆数量 当如果需求是,找出汽车厂商里的车一共有多少种颜色呢?  我们可以使用sum bucket ,默认情况下,可以参考官方文档 https://www.elastic.co/guide/e ... ml%23   但如果我们想找到售价大于100W的车,有多少种颜色呢? 这就需要Filter Aggregation   和 上文的sum bucket结合   这里有个需要注意的地方,sum_bucket的位置不要跟 Filter Aggregation 同级,而是应该在其下一级:
    "query": {
        "query": {
            "bool": {
                "filter": {
                    "bool": {
                        "must": [
                            {
                                "term": {
                                    "delflag": 0
                                }
                            },
                            {
                                "term": {
                                    "is_child": 1
                                }
                            }
                        ],
                        "must_not": 
                    }
                }
            }
        },
        "aggs": {
            "valid_sales_people": {
                "filter": {
                    "bool": {
                        "must_not": {
                            "terms": {
                                "status": [
                                    0,
                                    1,
                                    7
                                ]
                            }
                        }
                    }
                },
                "aggs": {
                    "render_people": {
                        "terms": {
                            "field": "uid",
                            "size": 2147483647
                        },
                        "aggs": {
                            "unique_people": {
                                "cardinality": {
                                    "field": "uid"
                                }
                            }
                        }
                    },
                    "member_count": {
                        "sum_bucket": {
                            "buckets_path": "render_people>unique_people" 
                        }
                    }
                }
            }
        }
    },
如代码所示,我希望对status not in (0,1,7)的uid(用户)进行聚合,并想得到uid桶种类的求和,那么member_count就应该与render_people同级,而不是把member_count放到和与valid_sales_people同一级。   如果将member_count 与valid_sales_people放到同一级,会报一个错:sum_bucket的第一个聚合必须是多桶聚合。究其原因,应该是加上filter aggregation后,valid_sales_people已不具有多桶聚合属性(因为附带了filter过滤条件),而其下的render_people则具有了多桶聚合属性。所以member_count应该与render_people放在同级,对应的buckets_path也自然改为render_people>unique_people