癌症单细胞表达图谱(Cancer Single-cell Expression Map)(https://ngdc.cncb.ac.cn/cancerscem/)当前一共收录了28个项目,涵盖了208个人类癌症样本(涉及20种癌症类型)。原始的单细胞 RNA 测序数据或基因表达矩阵来自多个数据库和文献,并分别针对10X Genomics平台及其他建库方案建立了数据处理流程。在每个样本的常规分析页面上,展示了:1)表达基因数、UMI计数和线粒体RNA比例的统计信息,2)以tSNE和UMAP方式进行的无监督细胞聚类,3)细胞成分及其比例,4)各细胞类型的差异表达基因列表及其GO/KEGG富集分析,5)功能性受体基因、配体基因、癌基因和抑癌基因的表达模式(以dotplot形式展示)。在在线分析页面,用户可以指定唯一的样本ID、基因符号或基因ID,查询目标基因在目标样本中的多维表达情况,或进行如细胞-细胞互作、生存分析等下游分析。
击导航栏中的"项目浏览"按钮后,将显示所有收集的癌症单细胞 RNA 测序项目的概览表格。

表格信息包含唯一项目 ID (Project ID)、癌症类型 (Cancer Type)、项目所属国家 (Country)、样本 ID (Sample ID)、样本详情 (Sample Type)、细胞数量 (Cell Count) 以及文库构建方案 (Construction Protocol)。样本 ID 的最后两个字符分别代表不同的文库构建方案:1A - 10X Genomics、1B - Smart-seq2、1C - Drop-seq、1D - Microwell 和 1E - Seq-Well。
根据左侧的导航栏可以进一步筛选需要的样本数据。

点击个样本分析可以自动跳转每个数据集肿瘤样本详细信息及其常规分析结果。


分析结果包括数据统计与 tSNE/UMAP 可视化"、"肿瘤微环境分析"和"功能基因表达"(受体基因、配体基因、原癌基因及抑癌基因)

数据库网站首页也提供了快速搜索和高级搜索两种搜索方式。
首页快速检索:支持用户通过癌症类型、基因符号或基因 ID 进行实时查询,系统将返回对应项目/样本及其分析结果,并生成目标基因的整体表达谱。

搜索页面的高级检索功能:可通过 4 个模块查询感兴趣的项目/样本或特定基因。

CancerSCEM 数据库有一个分析工具,在共包含4个分析模块:GENE、SAMPLE、CELL 和 METABOLISM。每个板块都有非常实用的功能。


分析模块 | 功能简介 |
|---|---|
GENE | 1. 查看指定癌症单细胞样本中目标基因的整体表达概况 2. 解析目标基因在不同细胞亚型中的表达水平 3. 分析特定样本下基因表达相关性 4. 比较不同单细胞RNA测序或TCGA批量测序数据中的基因表达 |
SAMPLE | 1. 跨单细胞样本的细胞类型组成比较 2. 构建并分析不同细胞类型间的细胞互作网络 3. 基于TCGA批量RNA测序及生存数据进行生存分析 |
CELL | 1. 可视化不同细胞类型(尤其是恶性细胞)的基因组拷贝数变异 2. 分析各细胞类型的转录因子富集情况 3. 推断目标癌症样本中的细胞发育伪时序轨迹 4. 计算包括细胞毒性、HLA相关受体、炎症反应等在内的七项关键生物学特征评分 |
METABOLISM | CancerSCEM 2.0新推出,用于代谢相关分析 |
数据库提供数据下载,可以根据项目编号或样本编号下载原始元数据、原始 UMI 计数矩阵(用于个性化分析)、各单细胞数据集对应的细胞组分文件及各细胞亚型的差异表达基因列表。

