英文标题 Identification of epigenetic modulators in human breast cancer by integrated analysis of DNA methylation and RNA-Seq data
在表观遗传中,DNA甲基化修饰具有非常重要的地位,甲基化修饰方式多种多样,其中胞嘧啶杂环5号位的甲基化修饰较为常见,又称为5-甲基胞嘧啶(5mC)。
DNA甲基化是一个生物过程,它会在在DNA分子中引入甲基化基团,但是甲基化并不会改变序列本身,而会改变DNA片段的活性。
癌症作为人类健康的头号杀手,引起了科研工作者的官方关注。鉴于DNA甲基化修饰在肿瘤中的重要作用, MethyCancer数据库整合了DNA甲基化数据和基因表达谱数据,将癌症与相关的基因联系起来,
对于三种真核生物RNA聚合酶来说,RNA聚合酶Ⅰ转录rDNA,与细胞的大部分RNA聚合酶活动有关;RNA聚合酶Ⅱ把结构基因转录成mRNA,并有着多样性最丰富的产物;而RNA聚合酶Ⅲ则转录小RNA。这些酶结构相似,都是由两个大亚基和许多小亚基组成,有些亚基在三种酶中都存在。
我们在对肿瘤样本进行研究的时候,为了保证研究质量,通常会选择肿瘤纯度高的样本,那么一般在分析前这样就需要评估样本纯度,接下来我们会介绍一些评估样本纯度的方法。
肝细胞癌 (HCC) 是一项全球性的健康挑战。早期诊断需要有效的生物标志物,以提高 HCC 患者的存活率。核酸外切酶 1 (EXO1) 在 DNA 修复和重组机制中起重要作用。
英文标题:Integrated Multiregional Analysis Proposing a New Model of Colorectal Cancer Evolution
The R-package regioneR v1.8 (Gel et al., 2016; R Core Team, 2016) was used to test resistance genes and genes exhibiting PAV and transposable elements for association using 500 permutations. For PAV association, the evaluation function numOverlaps was used to check whether the number of gene overlaps is higher than expected. For TE association, the evaluation function meanDistance was used since we do not expect TEs to overlap with RGA candidates due to repeats having been masked during the annotation process
哺乳动物基因组CpG位点通常集中在称为CpG岛(CpG island,CGI)的区域中,并且已知人基因启动子~60%含有CpG岛。CpG岛上下游不超过2000个碱基对(2kb)的基因组区域称为CpG“岛岸”(shores),其中CpG shelves指位于CpG shores 上下游2kb以内的区域,open sea指CpG islands、CpG shores和CpG shelves之外的其他区域。这4种情况形成了CpG resort。CpG位点的密度从island到open sea递减。
SurvivalMeth是哈尔滨医科大学李霞教授团队开发的,于2020年8月11日发表在Briefings in Bioinformatics上的针对DNA甲基化预后分析的数据库。
食管鳞状细胞癌 (esophageal squamous-cell carcinoma, ESCC) 占全球食管癌病例的 80%,5 年生存率低于 30%。 早期阶段通常比晚期阶段有更好的预后,但目前缺乏有助于早期诊断和准确预测预后的有效生物标志物。
Bedtools是处理基因组信息分析的强大工具集合,本文列出自己学习其官方文档的几个点,对后面计算不同样品peak相似性的脚本做了下更新和调整,使用起来更为简单方便。 内容摘要 区域注释,如peak注释,peak分布分析,peak与调控元件交集等。 区域合并,如求算多样品peak合集,或合并重叠区域 区域互补,如得到非基因区 利用比对结果对测序广度和深度评估 多样品peak相似性计算,评估ChIP类区域结果的样品相似性。 bedtools主要功能 bedtools: flexible tools for
有学徒表示虽然看了我在B站免费分享的视频课程《甲基化芯片(450K或者850K)数据处理 》,详见:免费视频课程《甲基化芯片数据分析》,但是课程过于强调实操,很多背景知识大家比较缺乏,所以学徒自告奋勇补充了一些甲基化基础知识,供大家学习!
增强子作为基因组上的顺式作用元件,在调控网络中发挥重要作用。随着研究的不断深入,科学家提出了超级增强子super-enhancer的概念,将基因组上富集了增强子的区域定义为超级增强子。
作者是生信技能树组建的表观遗传学学习小组的小组长,前面已经发过一个: 学员分享-Chip-seq 实战分析流程 本文是看到生信技能树有个450K甲基化芯片数据处理传送门,我呢,恰好不久前用一个集成度很高的ChAMP包分析过850K的甲基化芯片数据。所以,就想着把自己的笔记整理下,可以和更多的小伙伴学习交流,还有个原因可能是因为这是四月份打算学生信时,接手的第一个任务,曲曲折折好几个月才跑通流程,遇到的坑也比较多,想记录下来。 我之前分析时是参考ChAMP包的源文档,非常详细的整个流程的介绍,但是,在笔记快整
同样的策略,我们也可以应用到其它领域的知识背景快速学习,比如我们的lncRNA系列,miRNA系列,现在我们一起学习一下DNA甲基化吧。
2021 12/27基因日签 CpG岛易于甲基化 .壹. 关键概念 大多数DNA的甲基基团存在于CpG双联体的两条链的胞嘧啶上。 .贰. 关键概念 复制将全甲基化位点转变成半甲基化位点。 .叁. 关键概念 维持甲基化酶将半甲基化位点转变成全甲基化位点。 文字及图片信息均来源于Genes X(中文版),如有侵权请联系删除。 THE END
关于DNA甲基化检测手段介绍,阅读:Make Decision: DNA甲基化检测方法,哪一款适合你? 。同样的,早期研究以芯片为主,从成本的角度来看,也是芯片为主,但是测序数据更丰富。
CpG岛是200bp或更长的DNA序列,GC含量较高,一般富集在人类基因组组启动子区和起始外显子去,在这个区段容易出现DNA甲基化,从而对基因表达进行调控。 推荐工具CpGPlot
胞嘧啶第五碳的甲基化 (5- 甲基胞嘧啶:5mC) 是最早在真核生物中被挖掘出的甲基化类型,它也是今天我们要介绍给大家的重点。早在几十年前,就有体内外研究表明,它与转录抑制有关。
也帮忙去各种检索,但确实没有好的解决方案,就让她发过来2个G的原始数据和代码,认真检查了好久,看起来就是我的教程的代码,一模一样啊!
在每一个基因的序列当中包含了很多基因特征性的信息,比如:[[SNP是什么东西?| 基因SNP信息]];DNA甲基化的CG信息或者[[转录因子调控]]的motif信息等等。但是如果只是查看基因序列的[[Fasta基因序列格式]]是看不出这些内容的。所以就需要一个综合性的查看基因序列特征的工具。这个时候就可以通过一个叫做「基因组浏览器」的东西来进行查看。之前我们介绍的[[WashU Epigenome Brower-表观基因组浏览器]]是一个用来查看表观遗传信息的基因浏览器,今天就介绍一个综合性的基因浏览器:UCSC Genome Browser Home: http://genome.ucsc.edu/index.html
同样的策略,我们也可以应用到其它领域的知识背景快速学习,比如我们的lncRNA系列,miRNA系列,现在我们一起学习一下甲基化吧。
Bedtools是由犹他大学昆兰实验室开发的基因组算法工具集,用于广泛的基因组学分析任务。它堪称是基因组分析工具中的瑞士军刀。其设计灵活,可以轻松地与其他命令行工具集成,如 awk、grep、sort 等,使得它成为基因组研究和数据分析中不可或缺的工具之一。此外,bedtools 支持多种基因组数据格式,其中最常用的是 BED 格式,但也支持 VCF、GFF 和其他一些标准格式。由于其广泛的应用和功能,bedtools 成为了生物信息学家和基因组学者工具箱中的标准工具之一
通过ideogram和ticks这两个block, 我们能够把全部的染色体信息绘制在circos 图片中,但是染色体只是提供了一个基础的坐标系统,重点是染色体上相关区域的数据如何展示。
表型,英文名phenotype,译名表现型,是与基因型相对应的概念,是兴趣基因(或分子)之外另一个重量级对象。疾病、基因和表型,就构成了生信分析、基础科研的基本元素。中学时,我们都学过孟德尔遗传定律,其中绿色、矮茎等等是表型;描述人体特征的双眼皮、高鼻梁、宽额头、棕头发等等,也是表型。
DNA甲基化,对于做科研的小伙伴们或多或少不陌生吧,而R语言复杂的代码加上报错也常常让小伙伴们怒砸键盘不已!今天,小编给大家分享一个神器,让你轻松搞定甲基化数据分析。当然,如果有小伙伴对甲基化概念不甚了解,可动动手去文末查看!
Biostrings可以加引号。如果你想要查看这个包的说明文档,请点击链接http://www.bioconductor.org/packages/release/bioc/manuals/Biostrings/man/Biostrings.pdf,我们建议你在这次实验操作中保持文档打开以便于查询。
A DNA methylation signature to improve survival prediction of gastric cancer
今天和大家分享的是2020年1月发表在Cells(IF:4.366)上的一篇文章,“Computational Detection of Breast Cancer Invasiveness with DNA Methylation Biomarkers ”,作者在3个数据集中筛选了差异甲基化CpG位点,用4种不同的降维方法处理数据后构建分类器,并结合临床特征进行富集分析评估分类器的预测能力,为临床侵袭性乳腺癌的诊断提供帮助。
显示的主要结果是一个可视化各个组学信息的热图上。其中最上面的是对于每个信息的注释信息。下面的是具体的结果信息。结果信息包括
很久以前我们介绍过Sushi这个R包可以绘制基因组区域reads覆盖情况,这次我们介绍另外一个功能更强大的R包 Gviz:
ShiftLeft公司,成立于2016年,总部位于美国加利福尼亚州圣克拉拉市。该公司致力于将应用的静态防护和运行时防护与应用开发自动化工作流相结合以提升软件开发生命周期中的安全性。公司创始人Manish Gupta曾在FireEye、Cisco、McAfee等公司任重要职位。ShiftLeft在2019年2月获得了2000万美元的新一轮融资,总资金达到2930万美元。
Subgenomic RNA identification in SARS-CoV-2 genomic sequencing data 论文摘要:
但是实际上甲基化芯片才是最高频的产品,在人类研究领域主要是27k, 450k, 850k 以及最新的925k,而成熟的芯片早就有一系列公共资源在Bioconductor网页里面。
Genome Brower(基因浏览器)是一种把基因的结构按照序列核苷酸的顺序排列的浏览方式,我们在最基本的浏览器上能看到某一段区域内DNA水平下的核苷酸序列以及其基本的结构(内含子/外显子)。基于最基本的显示,我们可以把最一些和序列有关的特性添加到序列下方,来综合的显示这段序列的其他特性,比如说:SNP;CpG岛;组蛋白修饰的水平等等功能。
该 GNU cp 和 GNU mv 工具用于复制和移动文件和目录在GNU / Linux的操作系统。这两个应用程序中缺少的一个功能是它们不显示任何进度条。如果你复制一个大文件或目录,你真的不知道复制过程需要多长时间才能完成,或者复制的数据百分比。你不会看到当前正在复制哪个文件,或者已经复制了多少文件。你将看到的只是闪烁的光标和硬盘驱动器 LED 指示灯。感谢Advanced Copy,一个补丁Gnu Coreutils,我们现在可以在 Linux 中添加进度条cp和mv命令,并在复制和/或移动大文件和目录时
首先进入TCGA下载数据GBM的RNA-seq和甲基化数据,从下表可见GBM共有172套RNA-seq数据以及437套DNA甲基化数据,由于TCGA提供Infinium HumanMethylation27 BeadChip和Infinium HumanMethylation450 BeadChip两种芯片平台的数据,为了避免后续不同芯片平台间数据合并的困难,仅下载HumanMethylation450的芯片数据,共计154套。
文献精读(多组学联合分析):Integrative analysis of genomic and epigenomic regulation of the transcriptome in liver cancer
近些年来,过去被视作冗余垃圾的Noncoding RNAs被发现在基因表达调控中发挥了重要作用
本章的目的是为读者提供理解基因组学所需的一些基础知识。需要说明,这绝不是对这一学科的完整概述,而只是一个简单的总结,它将帮助非生物学相关专业的读者理解计算基因组学中反复出现的生物学概念。熟知基因组生物学和全基因组定量分析的读者可以自由跳过这一章或大致浏览一遍。
大家好,今天和大家分享的是2020年1月在发表在Clinical Epigenetics(IF=5.028)上的一篇文章:“ Prognostic and predictive value of PD-L2 DNA methylation and mRNA expression in melanoma”。作者构建了包含PD-L2靶向基因的珠芯片Beadchip,由此发现了PD-L2基因甲基化会引起mRNA表达量变化,最终导致黑色素瘤患者的存活率发生变化。此外,作者还探讨了mRNA表达量变化影响患者存活率的具体路径。
TCGA有自己的一批工具,ICGC也有自己的网站,但好的资源都是要整合起来,整合越多越好(虽然事实不一定如此,但有这个想法的人不少),用着才更方便。这就靠今天介绍的UCSC XENA来实现了。
大家对DNA应该都有一定的了解,那么DNA同样不仅仅是具有一级结构的碱基序列,而且还具有二级结构(双螺旋),三级结构(超螺旋)的特征。今天给大家介绍一个来预测DNA结构的R包DNAshapeR,其从基因组测序数据中以超高速、高通量的方式预测DNA形状特征。该软件包以核苷酸序列或基因组间隔作为输入,并生成各种图形表示,以供进一步分析。DNA预测使用滑动五聚体窗口,其中512个不同五聚体中的每一个都有独特的结构特征,从而在每个核苷酸位置(周向)定义了小沟宽(MGW),滚动,螺旋桨扭曲(ProT)和螺旋扭曲(HelT)的向量(周 等人,2013)。MGW和ProT定义碱基对参数,而Roll和HelT代表碱基对步长参数。首先我们看下需要安装的包:
前面八篇文章介绍了动态规划在序列比对中的基础应用。从本文开始,开始介绍HMM(隐马尔可夫模型)。为什么要介绍它呢?因为该模型在发现Motif、预测CpG岛等多方面有广泛的应用。而这些又和序列比对息息相关。所以我们要了解该模型。不过,为了方便,这一部分的开头几篇文章都会以掷骰子为例来对HMM展开讨论。
快速消费品 CPG(Consumer Package Goods)工业在全球经济中一直占有非常重要的地位,人们日常生活所需的消耗补充都离不开它,该行业的供应链相对较长,运行节奏较其它行业要快,因此其供应链就要求必须具有快速的响应速度。
遗传和非遗传因素有助于乳腺癌的发展。在易于获取的样本中捕获这些成分的基于表观基因组的特征可以识别处于危险中的女性。
大家好,今天和大家分享的是2020年3月发表在Journal for ImmunoTherapy of Cancer(IF=9.913)上的一篇文章:“LAG3 (LAG-3, CD223) DNA methylation correlates with LAG3 expression by tumor and immune cells, immune cell infiltration, and overall survival in clear cell renal cell carcinoma”,作者利用TCGA数据库的肾透明细胞癌(KIRC)数据进行分析,发现了编码免疫抑制分子LAG-3的基因的甲基化修饰与该基因在肿瘤和免疫细胞中的表达、免疫浸润以及总生存期的联系,并进一步在来自波恩大学附属医院(UHB)的KIRC样本中证实了这种联系,这一发现有望给LAG-3抗体疗法的临床试验提供参考。
成纤维细胞来源的相关基因在癌症患者中作为signature进行分型预后是近年的一大热点。
领取专属 10元无门槛券
手把手带您无忧上云