星空.png
前言
有一类业务场景,没有固定的schema存储,却有着海量的数据行数,架构上如何来实现这类业务的存储与检索呢?58最核心的数据“帖子”的架构实现技术细节,今天和大家聊一聊。...逛过58的朋友很容易了解到,这里的帖子信息:
(1)各品类的属性千差万别,招聘帖子和二手帖子属性完全不同,二手手机和二手家电的属性又完全不同,目前恐怕有近万个属性;
(2)数据量巨大,100亿级别;
(...可以新增若干属性满足存储需求,于是帖子表变成了:
tiezi(tid, uid, c1, c2, c3, c10, c11, c12, c13);
其中:
c1,c2,c3是招聘类别属性
c10,c11...,c12,c13是房产类别属性
通过扩展属性,可以解决存储的问题。...子品类,其value必须是一个short;
这样就对原来帖子表ext扩展属性:
{“1”:”driver”,”2”:8000,”3”:”bj”}
{”4”:”iphone”,”5”:3500}
key和