学生信为啥要学R语言:R语言拥有丰富的图表和Biocductor上面的各种生信分析R包。
如何安装和加载R包
1. 配置镜像:我猜这样下载R包会更快
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) # CRAN的清华镜像源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") # Bioconductor的中科大镜像源
1. 安装R包
R包安装命令是install.packages(“R包名”)
或BiocManager::install(“R包名”)
取决于要安装的包存在于CRAN网站还是Biocductor
加载R包
用library(“R包名”)加载R包,记得先有安装了,才可以加载使用。
dplyr包的学习
五个基本函数
- 首先构建一个储存数据的变量 test
- mutate() 用于新增一列数据
- 按列名筛选
vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars)) 对 test 数据框进行列选择操作,从中选取了包含在 vars 向量中的列,即 "Petal.Length" 和 "Petal.Width" 两列。其中 one_of() 函数用于匹配数据框中的列名,该函数可以接受一个或多个字符串向量作为参数,返回包含了与这些字符串向量匹配的列名的逻辑向量。实现了从 test 数据框中仅选取 "Petal.Length" 和 "Petal.Width" 两列作为新的数据框,并将结果赋值给一个新的数据框或覆盖原有的数据框。
- filter()筛选行
- arrange(),按某1列或某几列对整个表格进行排序
- arrange(),按某1列或某几列对整个表格进行排序
- summarise():汇总
计算分组的Sepal.Length的平均值和标准差
dplyr两个实用技能
管道操作 %>% (cmd/ctr + shift + M)
count统计某列的unique值
dplyr处理关系数据
- 內连inner_join,取交集
表示对于两个数据框中 "x" 列相同的行,将它们合并到一起。
- 左连left_join
表示对于两个数据框中 "x" 列相同的行,将它们合并到一起。左连接的结果包含左侧数据框(test1)中的所有行以及右侧数据框(test2)中与之匹配的行,如果在右侧数据框中没有与左侧数据框匹配的行,则该行会被填充为缺失值。
- 全连full_join
- 半连接:semi_join
表示对于两个数据框中 "x" 列相同的行,只保留左侧数据框(test1)中的行,并且去除右侧数据框(test2)中没有与之匹配的行。
- 反连接:anti_join
- 简单合并:相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数。
bind_rows()函数和bind_cols()函数
最最后,这里表示还有一个额外变量,怎么才能显示出来呢?
自问自答:这里是因为控制台面积太小了,把它拉大,然后重新运行代码就可以了~