前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >R语言实现sequence logos绘制

R语言实现sequence logos绘制

作者头像
一粒沙
发布于 2019-09-08 06:24:00
发布于 2019-09-08 06:24:00
1.6K00
代码可运行
举报
文章被收录于专栏:R语言交流中心R语言交流中心
运行总次数:0
代码可运行

我们前面讲过在python中如何实现测序图标(sequence logos)的绘制。今天给大家介绍一个在R语言中实现DNA,RNA以及氨基酸的logos绘制的R包motifStack。首先我们看下包的安装,主要是通过bioconductor进行安装,具体的代码不再赘述,请参看bioconductor官网。如果能完整展示绘图还需要另外一个ghostscript的软件,其官网(https://www.ghostscript.com/):

下载和自己系统对应的安装包,然后进行那些下一步………。软件就安好好了。接下来需要我们设置下环境变量,那我们就一个图展示下:

至此前期工作准备完了,然后就是重启电脑。如果还是无法画图那就可以在运行绘图时,前面直接运行如下代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Sys.setenv(R_GSCMD=F:/gs9.27/bin/ gswin64.exe”)

接下来我们直接看此包是如何实现logos的绘制的:

1. DNA sequence logos绘制:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##数据的读入library("motifStack")pcm <-read.table(file.path(find.package("motifStack"),                           "extdata", "bin_SOLEXA.pcm"))pcm <- pcm[,3:ncol(pcm)]rownames(pcm) <-c("A","C","G","T")
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##数据模型构建motif <- new("pcm",mat=as.matrix(pcm), name="bin_SOLEXA")#name就是绘图的标题
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##将所有的属性进行绘制对比opar<-par(mfrow=c(4,1))plot(motif)#plot the logo with same heightplot(motif, ic.scale=FALSE,ylab="probability")#try a different fontplot(motif, font="mono,Courier")#try a different font and a different colorgroupmotif@color <-colorset(colorScheme='basepairing')plot(motif,font="Times")

2. RNA sequence logos的绘制:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
rna <- pcmrownames(rna)[4] <- "U"motif <- new("pcm",mat=as.matrix(rna), name="RNA_motif")plot(motif)

3. protein logos绘制:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
protein<-read.table(file.path(find.package("motifStack"),"extdata","cap.txt"))protein<-t(protein[,1:20])
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
motif<-pcm2pfm(protein)motif<-new("pfm", mat=motif,name="CAP",           color=colorset(alphabet="AA",colorScheme="chemistry"))plot(motif)

3. position-specific affinity matrix logos的绘制:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
motif<-matrix(  c(   .846, .631, .593, .000, .000, .000, .434, .410, 1.00, .655, .284, .000,.000, .771, .640, .961,   .625, .679, .773, 1.00, 1.00, .000, .573, .238, .397, 1.00, 1.00, .000,.298, 1.00, 1.00, .996,   1.00, 1.00, 1.00, .228, .000, 1.00, 1.00, .597, .622, .630, .000, 1.00,1.00, .871, .617, 1.00,   .701, .513, .658, .000, .000, .247, .542, 1.00, .718, .686, .000, .000,.000, .595, .437, .970  ),nrow=4, byrow = TRUE)rownames(motif) <- c("A","C", "G", "T")motif<-new("psam", mat=motif,name="affinity logo")
plot(motif)

以上都是对单个样本的绘制,那么多个样本的绘制就会用到下面的函数motifStack ,其可以绘制"stack", "tree", "phylog","radialPhylog"四种形式的logos:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
motifs<-importMatrix(dir(file.path(find.package("motifStack"),"extdata"),"pcm$", full.names = TRUE))
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## plot stacksmotifStack(motifs,layout="stack", ncex=1.0)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
motifStack(motifs, layout="tree")
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
motifStack(motifs,layout="radialPhylog")

那如果想美化,那么可以参考下面的代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(RColorBrewer)color <- brewer.pal(12,"Set3")## plot logo stack with radial stylemotifStack(motifs,layout="radialPhylog",          circle=0.3, cleaves = 0.2,          clabel.leaves = 0.5,          col.bg=rep(color, each=5), col.bg.alpha=0.3,          col.leaves=rep(color, each=5),          col.inner.label.circle=rep(color, each=5),          inner.label.circle.width=0.05,          col.outer.label.circle=rep(color, each=5),          outer.label.circle.width=0.02,          circle.motif=1.2,          angle=350)

除此以外,此包还提供了更复杂的绘图:

1. Sequence logos 云图需要用到函数motifCloud:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library("MotifDb")matrix.fly <- query(MotifDb,"Dmelanogaster")motifs2 <- as.list(matrix.fly)## use data from FlyFactorSurveymotifs2 <-motifs2[grepl("Dmelanogaster\\-FlyFactorSurvey\\-",                         names(motifs2))]## format the namesnames(motifs2) <-gsub("Dmelanogaster_FlyFactorSurvey_", "",                      gsub("_FBgn\\d+$", "",                           gsub("[^a-zA-Z0-9]","_",                                 gsub("(_\\d+)+$","", names(motifs2)))))motifs2 <-motifs2[unique(names(motifs2))]pfms <- sample(motifs2, 50)## creat a list of object of pfmmotifs2 <- lapply(names(pfms),                  function(.ele,pfms){new("pfm",mat=pfms[[.ele]], name=.ele)}                  ,pfms)## trim the motifsmotifs2 <- lapply(motifs2, trimMotif,t=0.4)groups <-rep(paste("group",1:5,sep=""), each=10)names(groups) <- names(pfms)## assign group colorsgroup.col <- brewer.pal(5,"Set3")names(group.col)<-paste("group",1:5,sep="")## use MotIV to calculate the distances ofmotifsjaspar.scores <-MotIV::readDBScores(file.path(find.package("MotIV"),                                               "extdata",                                              "jaspar2010_PCC_SWU.scores"))d <- MotIV::motifDistances(lapply(pfms,pfm2pwm))hc <- MotIV::motifHclust(d,method="average")## convert the hclust to phylog objectphylog <- hclust2phylog(hc)## reorder the pfms by the order of hclustleaves <- names(phylog$leaves)pfms <- pfms[leaves]## create a list of pfm objectspfms <- lapply(names(pfms),function(.ele, pfms){                               new("pfm",mat=pfms[[.ele]], name=.ele)}               ,pfms)## extract the motif signaturesmotifSig <- motifSignature(pfms, phylog,groupDistance=0.01, min.freq=1)## draw the motifs with a tag-cloud style.motifCloud(motifSig, scale=c(6, .5),          layout="rectangles",          group.col=group.col,          groups=groups,          draw.legend=TRUE)

2. 多组放射树状图绘制:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## get the signatures from object ofmotifSignaturesig <- signatures(motifSig)## set the inner-circle color for eachsignaturegpCol <- sigColor(motifSig)## plot the logo stack with radial style.plotMotifStackWithRadialPhylog(phylog=phylog,pfms=sig,                              circle=0.4,cleaves = 0.3,                              clabel.leaves =0.5,                              col.bg=rep(color,each=5), col.bg.alpha=0.3,                             col.leaves=rep(rev(color), each=5),                             col.inner.label.circle=gpCol,                              inner.label.circle.width=0.03,                              angle=350,circle.motif=1.2,                             motifScale="logarithmic")

3. Circles图的绘制:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
motifCircos(phylog=phylog, pfms=pfms,pfms2=sig,           col.tree.bg=rep(color, each=5), col.tree.bg.alpha=0.3,           col.leaves=rep(rev(color), each=5),           col.inner.label.circle=gpCol,           inner.label.circle.width=0.03,           col.outer.label.circle=gpCol,           outer.label.circle.width=0.03,           r.rings=c(0.02, 0.03, 0.04),           col.rings=list(sample(colors(), 50),                           sample(colors(),50),                           sample(colors(),50)),           angle=350, motifScale="logarithmic")

4. 树状图热图的组合绘制:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## plot the logo stack with pile style.motifPiles(phylog=phylog, pfms=pfms,pfms2=sig,           col.tree=rep(color, each=5),           col.leaves=rep(rev(color),each=5),           col.pfms2=gpCol,           r.anno=c(0.02, 0.03, 0.04),           col.anno=list(sample(colors(), 50),                          sample(colors(), 50),                          sample(colors(),50)),           motifScale="logarithmic",           plotIndex=TRUE,           groupDistance=0.01)

当然此包还提供了JS的网页前端展示,在此我们就不再去描述。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 R语言交流中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
motifStack | 绘制motif序列结构图
我们在日常分析中,有时会比较不同物种间motif序列结构的保守性。今天小编教大家使用R包“ motifStack ”绘制美观的motif序列结构图!
生信小王子
2020/08/10
3.3K0
motifStack | 绘制motif序列结构图
序列LOGO绘制-你还需要美颜?
之前在公众号中分享过绘制LOGO的R包"gglogo",详情请戳蓝字“绘制序列标识图-gglogo”。今天再给大家分享一个R包-"ggseqlogo",绘制序列LOGO完全无需美颜。这个R包是ggplot2的扩展包,应用起来简单明了,下边就给大家详细测试下,看看是不是那么美,那么好!
作图丫
2022/03/29
1.1K0
序列LOGO绘制-你还需要美颜?
数据分析-cuttag分析流程分享3-个性化分析内容
在进行了前面两次的流程分析,目前已经得到了bedgarph文件和peak文件,需要在后面对peak文件进行相关的分析,主要有差异peak分析、peak的注释、注释基因的富集分析以及motif分析,我做了几次,发现里面的坑还是很多的。
小胡子刺猬的生信学习123
2022/04/06
5.6K6
数据分析-cuttag分析流程分享3-个性化分析内容
使用decoupleR一次性实现11种基因集的活性打分(R与Python我都要)
官网github链接:https://github.com/saezlab/decoupleR
生信技能树
2024/12/05
8070
使用decoupleR一次性实现11种基因集的活性打分(R与Python我都要)
单细胞转录组实战06: pySCENIC转录因子分析(可视化)
![生信交流与合作请关注公众号@生信探索](https://files.mdnice.com/user/38387/a8e0a2ed-ea22-4f3f-924e-881260dd9a2e.png)
生信探索
2023/02/22
3.1K0
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析19
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1:https://cloud.tencent.com/developer/article/2055573
小胡子刺猬的生信学习123
2022/09/25
4580
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析19
R语言三维图的绘制
R语言在可视化方面的地位是毋庸置疑的,但是呢相对于MatalabR语言在三维图形的展示上存在一定的劣势。当然,作为大众的免费软件,指定不服,很多人为此也基于R语言开发了一些相应的三维图的绘制包,像rgl,gg3D,plot3D,scatterplot3d等,我们今天就介绍一下其中的scatterplot3d。
一粒沙
2019/11/10
6.7K0
R包ggseqlogo 绘制seq logo图
在生物信息分析中,经常会做序列分析图(sequence logo),这里的序列指的是核苷酸(DNA/RNA链中)或氨基酸(在蛋白质序列中)。sequence logo图是用来可视化一段序列某个位点的保守性,据根提供的序列组展示位点信息。常用于描述序列特征,如DNA中的蛋白质结合位点或蛋白质中的功能单元。
生信宝典
2018/08/01
2.8K0
R包ggseqlogo 绘制seq logo图
一文详解如何用 R 语言绘制热图
AI 研习社按:作为目前最常见的一种可视化手段,热图因其丰富的色彩变化和生动饱满的信息表达被广泛应用于各种大数据分析场景。同时,专用于大数据统计分析、绘图和可视化等场景的 R 语言,在可视化方面也提供了一系列功能强大、覆盖全面的函数库和工具包。 因此,对从业者而言,用 R 语言绘制热图就成了一项最通用的必备技能。本文将以 R 语言为基础,详细介绍热图绘制中遇到的各种问题和注意事项。原文作者 taoyan,原载于作者个人博客,AI 研习社获授权。 简介 本文将绘制静态与交互式热图,需要使用到以下R包和函数
AI研习社
2018/03/19
3.7K0
一文详解如何用 R 语言绘制热图
绘图技巧 | 我总结了雷达图的绘制方法(R+Python)
今天给大家介绍的的图表为雷达图(Radar/Spider chart),这种类型图表在生活中较常使用,是一种以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据的图形方法。较常用的场景多为分析企业经营状况(收益性、生产性、流动性、安全性和成长性)。本期推文带你使R-Python绘制雷达图,主要内容如下:
DataCharm
2021/04/16
5.6K0
绘图技巧 | 我总结了雷达图的绘制方法(R+Python)
使用ChIPpeakAnno进行peak注释
ChIPpeakAnno是一个bioconductor上的R包,针对peak calling之后的下游分析,提供了以下多种功能
生信修炼手册
2019/12/19
2.5K0
课前准备-单细胞联合ATAC数据分析(SnapATAC2)
追风少年i
2024/06/20
2370
课前准备-单细胞联合ATAC数据分析(SnapATAC2)
scatterpie绘制气泡饼图及corrplot绘制相关性图
回顾之前我们介绍的BIB发表的工作:人类致癌通路的全面综述,文章中的绘图都很漂亮,小编发现文中主要的数据展示的绘图方法有饼图、堆积条形图、网络图、热图、箱式图、翻转条形图,都是一些比较常见的绘图方法,但是因作者比较善用配色,绘制的图形就看起来比较高级。吸引小编的是一组“饼图矩阵”,如下所示:
作图丫
2022/03/29
2.6K0
scatterpie绘制气泡饼图及corrplot绘制相关性图
超详细的R语言热图绘制之complexheatmap:01
本书是对ComplexeHeatmap包的中文翻译(1-6章),部分内容根据自己的理解有适当的改动,但总体不影响原文。如有不明之处,以原文为准。原文请见:https://jokergoo.github.io/ComplexHeatmap-reference/book/
医学和生信笔记
2022/05/30
4.3K0
全网最全的R语言基础图形合集
直方图是一种对数据分布情况进行可视化的图形,它是二维统计图表,对应两个坐标分别是统计样本以及该样本对应的某个属性如频率等度量。
生信学习者
2024/06/12
960
全网最全的R语言基础图形合集
科研绘图系列:R语言绘制SCI论文代码合集
The following code can be used to generate figures for the saliva adhesion assay and opsonic phagocytosis assay (OPK)
生信学习者
2025/02/19
640
科研绘图系列:R语言绘制SCI论文代码合集
R语言在树状图的末端标注物种值
R语言数据分析指南
2024/03/02
2250
R语言在树状图的末端标注物种值
R语言实现高级的韦恩图可视化
韦恩图大家应该都不陌生,主要用来展示不同事物或者组之间的数学或逻辑关系,主要用于集合的运算结果展示。今天给大家介绍一个在R语言中更加高级的展示形式,实现此功能的R包是UpSetR。首先看下包的安装:
一粒沙
2021/10/11
1.4K0
G3viz(r包)绘制基因棒棒糖图
首先,还是老习惯,推荐大家去学习官网:https://g3viz.github.io/g3viz/。
生信技能树
2025/02/05
1520
G3viz(r包)绘制基因棒棒糖图
Seurat 4.0 || WNN整合scRNA和scATAC数据
Seurat 4.0 ||您的单细胞数据分析工具箱上新啦 Seurat 4.0 ||单细胞多模态数据整合算法WNN Seurat 4.0 || 分析scRNA和膜蛋白数据
生信技能树jimmy
2020/11/09
3.9K1
Seurat 4.0 || WNN整合scRNA和scATAC数据
相关推荐
motifStack | 绘制motif序列结构图
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档