CellMarker 2.0 是一个基于单细胞 RNA 测序数据的人类/小鼠细胞标志物人工注释数据库。可以利用这个数据库去注释我们的细胞类型。
主界面左上角是一个人/小鼠的解剖定位图,可以切换物种查看不同组织分类信息,点击每个组织,会显示出来这个组织的细胞类型都有哪些:
点击某一个细胞类型会跳转至这个物种,这个组织含这个细胞类型的 Marker 基因界面,包含两个部分:Statistical graph of cell markers
, Source
。
Statistical graph of cell marker 部分是一个词云图加上具体的 marker 基因和数据来源计数。
Soure 显示的就是这个 marker 的来源是什么,分为实验来源和综述来源。
点击 Detail 可以看到这个 marker 来源的更详细的信息。
右上方有一个快速搜索界面,可以输入细胞类型,细胞 marrker 名称或者组织名进行快速搜索。
比如我搜索一个 T cell
:
主界面下方显示有六个工具,接下来详细介绍一下吧:
细胞注释工具主要是用来注释细胞类型的,需要选择相应的物种,组织类型,基因 ID 就可以自动注释出来啦。右侧的热图输入基因出现在哪些细胞类型标记中及其对应的细胞类型评分。可以把自己单细胞分析的高表达基因放到这里来初步鉴定一下是哪种细胞类型。
细胞聚类工具中展示了一些来自 GEO 数据库的单细胞数据集聚类分布情况。除了可以设置不同的数据集外,还可以设置使用 umap
还是 tsne
。还有分辨率(Resulution)可以在一定范围内设置,值越大,聚类数目越多。下方是每个簇中的差异表达基因,Pct-1 该cluster中表达该基因的细胞比例,Pct-2 是其他cluster中表达该基因的细胞比例。
细胞恶性程度工具可以展示一些内置数据集的细胞拷贝数变异信息。同时还可以选择 tsne 或者 umap 来可视化恶性和非恶性细胞。
细胞分化工具展示了内置数据集的聚类结果,细胞的拟时序和基因表达随时间变化的可视化图。
细胞表达工具可以显示内置数据集的差异基因在不同 cluster 的表达情况。
细胞通讯分析工具可以展示一些内置数据集的不同细胞类型键相互作用信息,可以设置不同的展示方式,有网络图,点图和热图等。
搜索界面就是可以根据细胞类型,组织类型,选择是否与癌症相关的 marker,细胞名称等选项。选择提交后同样就会返回词云图和 marker 基因来源表格。
可以以树状流的形式浏览不同组内的 marker 信息:
所有 marker 基因的信息表格 (很良心的数据库!)。
ACT (Annotation of Cell Types ) 虽然在 CellMarker 2.0 中没有专门提到这个工具(在第一代网站中有),但依然是一个很棒的网站。其能够促进高效的进行细胞类型注释流程。
当我们进行单细胞注释分析时候,在这个网页中选择相应的物种,组织及按照要求填写好每一个 cluster 有序上调基因,就会自动的对每一个 cluster 进行注释。
Cite:
Congxue Hu, Tengyue Li, Yingqi Xu, Xinxin Zhang, Feng Li, Jing Bai, Jing Chen, Wenqi Jiang, Kaiyue Yang, Qi Ou, Xia Li, Peng Wang, Yunpeng Zhang, CellMarker 2.0: an updated database of manually curated cell markers in human/mouse and web tools based on scRNA-seq data, Nucleic Acids Research, Volume 51, Issue D1, 6 January 2023, Pages D870–D876, https://doi.org/10.1093/nar/gkac947