在数据库中,提供了18种癌症相关的DNA甲基化,microRNA表达谱和基因表达谱的数据,这里的数据来源于数据库。同时采用线性回归的方法计算甲基化和表达谱数据之间的关联。
整个数据库包含的数据汇总如下:
相比其他的甲基化数据库,有以下两个特点:
数据来源于TCGA,同时包含了甲基化和基因表达谱以及microRNA表达谱的数据;
将基因划分为8个区域,甲基化位点划分为5个区域,针对单个区域计算甲基化和表达谱数据之间的相关性
基因和甲基化区域的划分方式如下所示:
和其他数据库比较的结果
在中,以单个基因为单位,查看该基因在癌症中的甲基化情况和表达量的情况
对于甲基化数据,其表达量采用值来衡量;对于基因表达谱数据,定量方式为;对于microRNA的表达谱,采用定量方式;通过泊松相关系数计算甲基化数据和表达谱数据之间的相关性。
以为例,给出所有基因区域和甲基化区域的结果
对于每个区域,会给出以下三个结果
甲基化数据和表达谱数据表达量的相关性分析
甲基化数据和表达谱数据差异倍数的相关性分析
TCGA数据库中记录的基因的甲基化和RNA_seq 数据详细情况
还提供了基因检索的功能,可以按照两种方式进行筛选
基因列表
KEGG通路
通过数据库,我们可以查看基因已有的甲基化和表达谱研究结果,也可以根据癌症类型,查看研究的较多的热点基因。
领取专属 10元无门槛券
私享最新 技术干货