使用 dmesg 来查看一些硬件或驱动程序的信息或问题。

ES怎么设计用户画像的标签宽表

Elasticsearch | 作者 ty2zht | 发布于2019年07月19日 | 阅读数:8120

普通标签的话用普通字段就搞定了,如果一个标签是买过的SKU及个数,如果买过多个(一般不超过10个)SKU的话,这多个SKU该怎么存储?使用什么结构,既能够筛选出这个SKU又能够根据个数筛选,而且支持多个SKU一起筛选?
数组的话,没办法晒SKU跟个数,父子的话,占用内存比较严重,netsed的话,查询性能又不能保证,如果是直接用10个字段的话,又不能保证 万一人家有第十一个咋办

各位大神,有没有什么合理的数据存储结构,能否借鉴一下
已邀请:

bindiego - be cool

赞同来自:

ES的话nested结构是一个维护自定义指标具体数值和指标关联的办法。然后就是你说的宽列也可以,但是一个用户10个SKU,1万个用户如果大家买的东西不一样的话,最多可能是10万列,当然例子比较夸张啊。还有一个思路就是这些指标具体的值是否那么重要,可以把指标当作标签来处理,比如年龄组,少年、青年、老年,不用具体年龄,这个牵扯一个更新,不过最多也1年更新一次。SKU的话可以是累计,SKU_A_1, SKU_A_10, SKU_A_100, SKU_B_20 etc. etc. 

要回复问题请先登录注册