Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DAY6-学习R包

DAY6-学习R包

原创
作者头像
用户11039964
发布于 2024-03-27 15:44:32
发布于 2024-03-27 15:44:32
1530
举报

安装和加载R包

1.镜像设置

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源

options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") # 对应中科大源

2.安装

install.packages("包")BiocManager::install(“包”)

3.加载

libraryrequire

代码语言:2
AI代码解释
复制
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

示例数据:

test <- iris

test <- iris[c(1:2,51:52,101:102),]

dplyr五个基础函数

1.mutate(),新增列

代码语言:2
AI代码解释
复制
mutate(test, new = Sepal.Length * Sepal.Width)
图片引自生信星球
图片引自生信星球

2.select(),按列筛选

代码语言:2
AI代码解释
复制
select(test,1)
select(test,c(1,5))
select(test,Sepal.Length)
select(test, Petal.Length, Petal.Width)
vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))

3.filter(),筛选行

代码语言:2
AI代码解释
复制
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5 )
filter(test, Species %in% c("setosa","versicolor"))

4.arrange(),按某1列或某几列对整个表格进行排序

代码语言:2
AI代码解释
复制
arrange(test, Sepal.Length) #默认从小到大排序
arrange(test, desc(Sepal.Length)) #用desc从大到小
```\

4.summarise(),汇总

代码语言:2
AI代码解释
复制
summarise(test, mean(Sepal.Length), sd(Sepal.Length)) #计算Sepal.Length的平均值和标准差
group_by(test, Species)  #先按照Species分组
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length)) #计算每组Sepal.Length的平均值和标准差

dplyr两个实用技能

1.管道操作

%>% 或 (ctrl + shift + M)

2.count统计某列的unique值

count()

dplyr处理关系数据

即将两个表连接

代码语言:2
AI代码解释
复制
test1 <- data.frame(x = c('b','e','f','x'), 
                    z = c("A","B","C",'D'))
test2 <- data.frame(x = c('a','b','c','d','e','f'), 
                    y = c(1,2,3,4,5,6))

1.内连接inner_join,取交集

代码语言:2
AI代码解释
复制
inner_join(test1, test2, by = "x")

2.左连left_join

代码语言:2
AI代码解释
复制
left_join(test1, test2, by = 'x')
left_join(test2, test1, by = 'x')

3.全连full_join

代码语言:2
AI代码解释
复制
full_join( test1, test2, by = 'x')

4.半连接:返回能够与y表匹配的x表所有记录semi_join

代码语言:2
AI代码解释
复制
semi_join(x = test1, y = test2, by = 'x')

5.反连接:返回无法与y表匹配的x表的所记录anti_join

代码语言:2
AI代码解释
复制
anti_join(x = test2, y = test1, by = 'x')

6.简单合并

在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

代码语言:2
AI代码解释
复制
test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))
test2 <- data.frame(x = c(5,6), y = c(50,60))
test3 <- data.frame(z = c(100,200,300,400))
bind_rows(test1, test2)
bind_cols(test1, test3)
图片来自生信星球
图片来自生信星球

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Day-6 香波🐟
6.简单合并:在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
波小囡
2023/12/02
2310
Day-6 香波🐟
Day6-Bran R包
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
用户10858331
2023/12/02
2050
岩酱的生信学习笔记Day6(R包的安装和使用)
用户11074124
2024/04/18
1170
Day6——R包的学习
菜单栏-Tools-Packages-Primary CRAN repository-选择国内镜像
掩扉先生
2023/10/25
2380
Day4-R包学习
将 CRAN 镜像地址设置为了清华大学的镜像站点。这样,在使用 R 语言安装或更新包时,系统会优先从清华大学的镜像站点下载,从而加快下载速度
昆兰
2024/05/10
1630
Day6-学习R包
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
用户11075959
2024/04/19
1530
Day6-R包
今天的内容在我刚看到的时候,觉得很难,看不懂每一步代码的意思,不知道是如何得到花花老师的结果的,但是在自己一步一步按照教程来进行操作,仔细比对前后的变化的时候,我对dplry包的使用有了更清晰的认识,这一部分内容需要自己多多练习,才能体会其中的含义。
用户11009106
2024/03/10
1700
生信技能树七天学习小组 Day6笔记——学习R包
install.packages()/BiocManager::install()
可乐同学与生信死磕到底
2024/03/28
1970
Day6-蓝色柠檬
今天的任务是学习R包。以dplyr包的安装加载和使用为例进行学习,因为R包之间的使用是相通的,掌握了一个,后面的可以通过具体代码的学习进行使用。dplyr这个包我以前没有接触过,从这个入手,又能学习到新东西真不错。
用户10817043
2023/11/04
3560
第6天生信学习笔记-微信公众号生信星球
R包是多个函数的集合,R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。
用户10986402
2024/02/25
1800
Day6-梦琪
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 对应清华源
小焦学生信
2023/12/02
2330
DAY06-R包学习
靓且有猫
2024/06/16
1780
Day6:学习R包
用户10859122
2023/12/03
2250
Day4——查布铎徳勒
用户10663172
2023/07/21
2430
学习小组day6笔记-R包
all_of(): Matches variable names in a character vector. All names must be present, otherwise an out-of-bounds error is thrown.
清南
2023/04/13
4100
学习小组笔记Day06-RUI
教程:https://mp.weixin.qq.com/s/XvKb5FjAGM6gYsxTw3tcWw
RUI GU
2023/02/11
5330
DAY6- R包的使用
用户11039705
2024/03/28
2140
Day6 学习R包(今天依旧是干货满满但是要注重理解)
海雀
2024/03/09
1540
学习小组Day6-bubble
还有一种像Linux一样直接修改R中的相当于Linux中的.bashrc/环境文件一样的R的环境文件.Rprofile即可
bubble
2023/11/05
3321
Day6-橙子
用户11110663
2024/05/11
2000
Day6-橙子
相关推荐
Day-6 香波🐟
更多 >
LV.0
这个人很懒,什么都没有留下~
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档