我从一组在某种生物物质中最常发现的100个基因开始,这个列表被称为"top100“。使用MERGE,我设法从每个样本的数据集中获得了这100个蛋白质中的每一个的计数。我想绘制每个样本中每个单独蛋白质的计数图。
所以基本上我想要一个图,它显示了,例如,蛋白质: PKM和每个样本(在这个例子中是N=2)的计数,然后我想对单个图中的所有100个蛋白质重复这个过程。
row.names Gene.Symbol Normalised.count.(B) Normalised.count.(A)
1 1 A2M 46.073855 280.736354
2 5 ACTN4 0.000000 10.436296
3 8 ALDOA 39.354751 61.574145
4 9 ANXA1 1.919744 1.043630
5 13 ANXA5 8.638848 0.000000
6 17 BSG 5.759232 1.043630
7 22 CD81 1.919744 2.087259
8 23 CD9 2.879616 4.174518
9 25 CFL1 5.759232 10.436296
10 26 CLIC1 1.919744 10.436296
这是总列表的1/10,所以对于每个基因符号,我希望将两个归一化计数值绘制在
X1 =基因符号y= normalised.count。(A)
X2=基因符号y= normalised.count.(B)
这就是我到目前为止要排序到最终列表的内容。
library("openxlsx")
library("dplyr")
library("ggplot2")
library('reshape2')
library('gdata')
protein_report <- read.xlsx(file.choose(), sheet=1)
top100 <- read.xlsx(file.choose(), sheet=1)
norm <- matchcols(protein_report,with = "Norm")
top <- na.omit(merge(top100, protein_report[c("Gene.names",norm)], by.x="Gene.Symbol",by.y="Gene.names", all.x = T, all.y = F))
如何绘制这些值?
发布于 2015-11-24 14:28:21
您可以使用tidyr和聚集函数首先将数据整形为长格式,然后使用ggplot对其进行绘图
library(tidyr)
library(ggplot2)
plotData <- protein_report %>% gather(type,Normalised.count,
Normalised.count.A,Normalised.count.B)
ggplot(plotData,aes(x=Gene.Symbol,y=Normalised.count,color=type) +
geom_line() ## For a line plot
https://stackoverflow.com/questions/33895850
复制相似问题