上期推荐了一个数据库:人类细胞图谱 - 单细胞数据和 Marker 信息,那这次我们来看一个小鼠细胞图谱数据库。
http://bis.zju.edu.cn/MCA/
截至目前,MAC (小鼠细胞图谱, Mouse Cell Atlas) 有四个版本的图谱数据:
MCA 1.0:分析了来自10余种小鼠组织的40多万个单细胞(每种组织一般有2-4个重复)。
MCA 1.1:全局视角下,完整的小鼠组织数据集被分为104个主要的细胞簇。
MCA 2.0(小鼠细胞分化图谱):分析了来自10余种小鼠组织、7个生命阶段(E10.5、E12.5、E14.5、P0、P10、P21、成年)的52万余个单细胞,涵盖了从早期胚胎阶段到成熟成体阶段。在全局视角下,完整的数据集被分为95个主要细胞簇。
MCA 3.0(小鼠细胞发育与衰老图谱):分析了约113万个单细胞,覆盖10余种小鼠组织、10个生命阶段(E10.5、E12.5、E14.5、新生儿、10天、3周、6~8周、12月、18月、24月),同样涵盖了从早期胚胎到成熟成体的全过程。在全局视角下,完整的数据集被分为177个主要细胞簇。
以最新的 MCA 3.0 为例,可以全局查看,也可以根据需求选择相应的组织,Cluster,和基因。
比如我选择了 Lung,cluster1,TP53 基因,看网页右侧,就会有三个部分的聚类图出现,首先是 lung 组织对应的细胞类型都有哪些:
其次是关于 cluster1 的聚类图分布情况,请注意,这包含所有的 cluster1 细胞,并不是 Lung 组织独有的。
在 marker list 界面,对应 cluster1 也有相应的标志基因可供参考:
在图库中,可以下载单细胞数字基因表达(DGE)矩阵,并获取每个数据的细胞数量及样本来源信息。基于标记基因的聚类分析结果也共享在图库中。
以肌肉 (Muscle) 为例,有两个系列的数据:
在详情页中有数据的 t-SNE 图展示,亚群的 top markers, 在右上角的下载按钮中不仅下载了 DEG,还包含原始数据的表达矩阵。自己可以重新分析或者做一些个性化方案。
包含两种搜索方式:组织搜索和图谱搜索。在组织搜索中,可在选定样本中搜索基因,将返回该基因表达柱状图。在图谱搜索中,可在完整 MCA 数据集中搜索基因,将返回该基因在前 20 种细胞类型、组织和发育阶段中的表达柱状图。
可以上传 RNA-seq 数据(单细胞 RNA-seq 数据或批量 RNA-seq 数据)的 DGE 矩阵,scMCA 将协助鉴定数据中的细胞类型。结果通过交互式热图和 CSV 格式表格展示。热图中,行代表定义的细胞类型,列代表待查询样本,色块颜色反映相关性强度。结果表格提供待鉴定样本与参考细胞类型之间的皮尔逊相关系数。
数据要求:
可以下载数据表格进一步查看:
偷偷告诉你,还有一个人类细胞景观数据库,使用方法一致。 http://bis.zju.edu.cn/HCL/