即使是不成熟的尝试,也胜于胎死腹中的策略。

已知独立访问表,pv表,转换表。(关联和文档嵌套的问题)

Elasticsearch | 作者 dingyangfan | 发布于2016年05月25日 | 阅读数:5000

主要用来做统计 ,目前只打算用它,大家只讨论这个问题哈
已知独立访问表(A),pv表(B),转换表(C) 以下都用字母表示
1.如果是关联的话那么(B,C都关联A)等于讲B,C的parent就是A
这样做大量的数据聚合统计的话,会有什么影响。
2.B,C都直接嵌套在A里面做为子嵌套
(以上B,C可能有多条数据对应A一条数据)
哪种方法比较合适我目前的应用?主要用来做聚合+少量的查询
 
各位大神解答一下吧,困扰很久了,虽然这不是最合适的,但是没办法。
哪种方法比较合适,还有就是需要注意哪些坑
补充:数据量差不多一天在2-3亿左右。
已邀请:

medcl - 今晚打老虎。

赞同来自:

不建议你在es做join操作,parent-child能实现部分功能,但是它的开销比较大,如果可能,尽量在设计时使用扁平的文档模型。

joeywen

赞同来自:

我们也在考虑es 做join,有个开源实现siren-join, 可以参考下。

要回复问题请先登录注册