近年随着测序技术的不断完善,生物领域积累了大量基因组、转录组、表观组学数据。怎样有效利用这些数据挖掘生物学新知识,是研究工作者在大数据时代面临的挑战。2018年1月17日,南方科技大学翟继先团队、福建农林大学王海峰团队与美国加州大学洛杉矶分校Steven Jacobsen团队合作,在美国Proceedings of the National Academy of Sciences(PNAS)在线发表了题为 “Large-scale comparative epigenomics reveals hierarchical regulation of non-CG methylation inArabidopsis” 的研究论文。
该研究以DNA甲基化测序数据入手,探索了大数据挖掘揭示生物学新知识的研究之路。作者重新分析了公共数据库中来自不同实验室的约500组Col-0型拟南芥DNA甲基化数据:通过比较单个突变体和多个野生型,鉴定了每个突变体中高置信度的DNA甲基化差异区域;进而分析了不同突变体间DNA甲基化差异区域的重合度,揭示控制DNA甲基化相关基因之间的联系。
不同突变体DNA甲基化差异区域重合度的聚类分析
据悉,南方科技大学张雨博士与加州大学洛杉矶分校Jake Harris博士,刘启昆(Qikun Liu)博士为该论文的共同第一作者。翟继先博士、Steven Jacobsen博士和王海峰博士为本文的通讯作者。本项目得到了国家自然科学基金、中组部“千人计划”青年项目、广东省“珠江人才计划”创新创业团队项目、南方科技大学校长卓越博士后基金的资助。
领取专属 10元无门槛券
私享最新 技术干货