R包是多个函数的集合,具有详细的说明和示例。
本次以dplyr为例
运行这两行代码
options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
R包安装命令:install.packages()或者BiocManager::install()
具体使用哪一个命令取决于要安装的包存在于CRAN网站还是Biocductor,可以谷歌必应搜到存放位置。
eg:
安装来自cran的stringr包:install.packages("stringr")
安装来自Biocductor的limma包:BiocManager::install("limma")
library和require,两个函数均可。
使用一个R包:先安装,再加载,最后使用
实操代码(依旧以dplyr为例)
options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/") install.packages("dplyr") 示例数据采用R的内置数据,test <- irisc(1:2,51:52,101:102),
dplyr包不仅可以对单个表格进行操作,也可以对双表格进行操作。
dplyr包有很多函数,为了防止dplyr包中的函数名与其他函数产生冲突,使用时前面加上“包名::”
注意筛选内容与表格内容的统一,包括大小写
arrange(test, Sepal.Length)#默认从小到大排序
arrange(test, desc(Sepal.Length))#用desc从大到小
summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差
eg:先按照Species分组,计算每组Sepal.Length的平均值和标准差
group_by(test, Species)
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
(加载任意一个tidyverse包即可用管道符号)
即将2个表进行连接
Semi-Join半连接,当外表在内表中找到匹配的记录之后,Semi-Join会返回外表中的记录。但即使在内表中找到多条匹配的记录,外表也只会返回已经存在于外表中的记录。
注意返回的表的不同
注意返回的表的不同
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
?sd
?dplylr
可以用问号连接任何想知道使用方式的函数名称
##Vignettes
这个单词硬翻译会翻译成“小插图”,其实就是作者写的网页版教程,不是每个R包都有的,可以运行代码试试看,没有就是没有了。
browseVignettes("limma")
实操
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。