对另一个变量使用带有case_when条件的dplyr::mutate_at - 腾讯云开发者社区

如果确实如此，那么将对这些变量进行mutate指令。 *mutate_at（）要求你在vars（）参数中指定要进行变异的列。...在这些情况下，我们必须在给出round（）指令之前添加列需要为数字的条件，这可以使用mutate_if来完成。通过使用mutate_if（），我们在管道中需要两个参数：首先，它需要有关列的信息。...（多个级别） ifelse（）可以嵌套，但如果你想要两个以上的级别，但是使用case_when（）可能更容易，它允许你喜欢的语句数量多，并且比许多嵌套的ifelse更容易阅读声明。...不幸的是，似乎没有简单的方法让case_when（）返回一个有序的因子，所以你需要自己做，之后使用forcats :: fct_relevel（），或者只是一个因子（）函数。...，可以使用dplyr中的连接函数。

8.1K3 0

R语言第二章数据处理⑤数据框列的转化和计算目录正文

正文本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数： Mutate（）：计算新变量并将其添加到数据表中。它保留了现有的变量。...Transmutate（）：计算新列但删除现有变量。...Mutate_at（）/ transmutate_at（）：将函数应用于使用字符向量选择的特定列 Mutate_if（）/ transmutate_if（）：将函数应用于使用返回TRUE的谓词函数选择的列...选择predicate为或返回TRUE的变量。...转换特定列 mutate_at（）：转换按名称选择的特定列： my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),

4.2K2 0

您找到你想要的搜索结果了吗？

是的

没有找到

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...（包括 lambda 函数）的命名列表来对每个变量同时执行多个函数操作。..._if, _at, _all 「dplyr」以前的版本允许以不同的方式将函数应用到多个列：使用带有_if、_at和_all后缀的函数。这些功能解决了迫切的需求而被许多人使用，但现在被取代了。..._at() 函数是「dplyr」中唯一你需要手动引用变量名的地方，这让它们比较奇怪且难以记忆。为什么过了这么久才发现 across()？...」的开发者们通过 across() 简化了「dplyr」对于一些数据复杂操作的处理逻辑，提高了整体的学习和使用效率，让我们使用者更关注于逻辑而非实现上。

2.4K1 0

R语言专题3-条件和循环

专题3.条件和循环1.条件语句-if(){}1.1 只有if# if()里的内容一定得是逻辑值，可以是你写上的T和F，也可以是运算结果# 若运算结果为T或者你写上了T，他就会执行后续语句，反之则不执行#...# 1.if(F){},则{}里的代码被跳过# if(T){},则{}里的代码被运行# 凡是带有{}的代码均可以被折叠1.2 有else这部分可以简单理解为如果......，大家可以先从看懂模仿开始## [1] "0"补充:case_when()# 用之前先加载R包dplyrlibrary(dplyr)# 先来个简单的,case_when是按顺序进行判断的i = 0case_when...按顺序进行判断，条件严格的往前写哈# 这个用来看p值比较多case_when(x dplyr

2463 0

Python & R 控制流大比拼！建议收藏！

ifelse y = c(3,5,-1,0) ifelse(y>0,"pos","neg") ## [1] "pos" "pos" "neg" "neg" case_when 如果有多个条件，可以使用...dplyr包中的case_when。...library(dplyr) case_when( y > 0 ~ "pos", y < 0 ~ "neg", TRUE ~ "0" ) ## [1] "pos" "pos" "neg"..."0" case_when会从第一个条件开始判断，是T就输出相应的值，是F就再判断下一个条件。...方法如果是多个条件，那就使用pandas里的case_when方法 import pandas as pd y = pd.Series([3,5,-1,0]) y.case_when([ (y

600 0

R&Python Data Science 系列：数据处理（2）

2 条件函数这里介绍3个条件函数，if_else()、case_when()、between()函数，Python包dfply和R包dplyr中都是这3个函数，在用法上有点细微差别，日常中使用最多...，在构建评分卡woe赋值的时候特别好用。...而且if_else()函数可以嵌套使用，不过当条件判断超过2个的时候，建议使用case_when()函数。...注意：python在jupyter中使用管道函数换行书写代码的时候需要用()把代码括起来。 2.2 case_when函数用于多条件赋值，评分卡Woe赋值的时候使用起来很方便。...注意：case_when函数在Python和R语言中使用的时候有点区别，请留意。

7751 0

R语言批量生成CaseWhen的解决方案

大家好，又见面了，我是你们的朋友全栈君。近期写R代码，经常用dplyr::case_when结合stringr::str_detect进行条件判断。...痛点：判断条件可能会改或增删，全写在case_when里，代码冗余且不利于复制和维护，stackoverflow找了一圈，没发现好的解决方案，干脆自己写了一个通用代码以自动生成批量case_when判断...) 使用示例：初始表tibble(fruit=stringr::fruit) 想实现字母a开头为’starts with a’，字母e结尾为’ends with e’ 等若干条件。...用改良后的allCaseWhen会简单很多，两步解决： 1....函数的核心依然是case_when，条件为真即停止，所以效率上没有损失。如果想改条件，在conditions里放肆增删改，改完再跑一遍allCaseWhen即可。

6162 0

生信马拉松 Day7

(x1) #转matrix x3 = head(x2,50) #只要前50行 pheatmap::pheatmap(x3) #画热图 #使用管道符%>%的代码 iris %>% select(-5...条件和循环，if，for 碎碎念：这个东西每次好久不用就想不起格式要重新查，脑子是个好东西，就是漏的厉害 rm(list=ls()) #if的格式 if (){ #if后面的括号里只能是一个逻辑值...(dplyr) i = 0 ifelse(i>0,"+",ifelse(i<0,"-","0")) case_when(i>0 ~ "+", i<0 ~ "-",...0.2333333 apply(test, 1, sum) ### 2.lapply(list, FUN, …) # 对列表/向量中的每个元素实施相同的操作 lapply(1:4,rnorm....如何进行长脚本的管理 1.可以用if(F){}来进行长脚本的管理，带有{}的代码，可以被折叠 2.分成多个脚本，每个脚本最后保存Rdata，下一个脚本开头清空再加载，不推荐表格文件生信技能树，生信马拉松

2530 0

Day07 生信马拉松-数据整理中的R

全文并非是对数据整理的实操整理,主要整理在数据整理/清洗中常用的R包介绍 library(tidyr) library(dplyr) library(stringr) library(tibble) 1...2.4 连续步骤的不同方法 2.4.1 多次赋值，产生多个中间的变量 x1 = select(iris,-5) #"-5"为删除第5列 x2 = as.matrix(x1) x3 = head(x2,50...>,,) x = rnorm(3) x ifelse(x>0,"+","-") ★★★★★ifelse()+str_detect(),条件筛选的王炸组合★★★★★ samples...### library(dplyr) i = rnorm(10) case_when(i>0 ~ "+", i<0 ~ "-", T ~ "0") ★★★★★长脚本的管理方式...进行转置：使gene名变为列名，将样本名转化为data.frame中的第一列 ggplot2对行名并不友好，通常要使样本名转化为data.frame中的第一列，防止在后续代码运行过程中行名丢失图片图片

2390 0

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

,代码运行凡是带有{}的代码，均可以被折叠下载数据的代码，保留但不反复运行，用if(F){...},可以控制其不运行但保留。...save(pd,exp,gpl,file = "steploutput,Rdata")，这句代码将几个第一个脚本有用的变量保存到Rdata文件中，下次使用这些变量时直接加载load这个Rdata文件即可...Rdata可以保存多个变量，下次使用只需要一次load可以的到多个数据。-Rdata不仅可以保存数据框，也可以保存其他任何数据结构，包括复杂的对象！...代码2实现结果和代码1相同2.6 练习library(dplyr)x = c(-1,-1,4,5,2,0)case_when(x>0 ~ "A", x==0 ~ "0",...跟多个条件的两句代码比较看哈！！

1920 0

R tips：使用TCGAbiolinks包下载TCGA数据

目前有两大类TCGA数据可供下载，一个是Legacy，主要是一些使用 GRCh37 (hg19) 和GRCh36 (hg18)的数据，另一个是harmonized数据，统一使用GRCh38 (hg38)...生存分析时根据基因的中位数将其分为High和Low，使用log-rank检验显著性，也可以使用cox回归。...log-rank和cox回归的区别在于是cox是半参数检验，需要对数据有一些先验假设，另外cox回归并不不局限于拟合数据是分类变量，也可以是连续变量。...对象，里面的plot就是实际的ggplto2对象，如果有添加risk.table的话，那么里面的table元素就是实际的ggplto2对象。...可以自己提取元素plot和table，然后使用patchwork或者cowplot合并，则可以将ggsurvplot转为ggplot2对象，然后就可以自由的拼合多个生成图形了。

3.4K3 1

70-R茶话会15-你的编程菜鸟路上缺失的一课

不谋而合的是，很多我之前都介绍过了。这就是优秀者们的马太效应吗！ 1-switch和case_when 在做数据分析时，常常遇到的一个场景是，1,2,3 需要转换成其对应的"a","b","c"。...，dplyr 提供了向量化的操作[[37-R茶话会07-高效的处理数据框的列]]： > dplyr::case_when( + tmp %in% "a" ~ 1, + tmp %in% "b"...：[[05-R工具指南04-俺的技巧与Rstudio的快捷键]] 3-通过设置系统变量保护脚本中的密码不外露如果你的脚本中需要你的某些签名或密码，最好不要把他们放在脚本里，因为你的脚本可能会分享给其他人...可以使用系统变量： Sys.setenv( DSN = "database_name", UID = "User ID", PASS = "Password" ) 接着在脚本中使用这些键即可...5-学会在你的R 分享内容里使用变量以Rmd 为例子: You can do this by defining parameters in the YAML header of your R Markdown

3K4 0

大更新，pandas终于有case_when方法了！

数分小伙伴们都知道，SQL中的case when语句非常好用，尤其在加工变量的时候，可以按照指定的条件的进行赋值，并且结合其他嵌套用法还可以实现非常强大的功能。...df['score_all'] = df.sum(axis=1) 对加工的总成绩列使用case_when方法，生成1-5的排序等级。...这里输入series是score_all，判断条件用的是english。替换值：替换值使用了lambda隐函数对输入series计算。...案例3 case_when只实现区域内的变量加工，其输出结果也可以与其他函数方法结合，产生更多强大的功能。...比如，可以将以上全部变量加工过程通过链式的方式更优雅的实现，结合assign的使用一行代码可完成全部。

4161 0

tidyHeatmap使用长数据绘制热图

tidyHeatmap基于ComplexHeatmap，遵循图形语法，最大的好处是直接使用长数据画热图，这是目前其他画热图的R包所不具备的。...每一列是一个变量，每一行是一个观测！...mtcars_long % as_tibble(rownames = "car name") %>% mutate_at(vars(- `car name`,-hp,...tidy，直接使用group_by()即可。...data = -sample) |> dplyr::mutate(size = rnorm(n(), 4,0.5)) |> dplyr::mutate(age = runif(n(),

3942 0

R语言基础5（绘图基础）

geom_bar(mapping = aes(x = cut)) ggplot(data = diamonds) + stat_count(mapping = aes(x = cut)) #统计变换使用场景...##筛选行列 select() filter() # 连续的步骤 # 1.多次赋值，产生多个中间的变量 x1 = select(iris,-5) x2 = as.matrix(x1) x3 = head...#用之前需要加载stringr包或dplyr包，快捷键ctrl+shift+M 条件或循环 rm(list = ls()) ## 一.条件语句 ###1.if(){ } #### (1)只有if...#x是数据框或者矩阵 #margin为行则是1，margin为列是2; #fun为函数 #apply(test,2,mean) #对test的每一列求平均值 sort(x) #对x从小到大排序 head...#对列表向量中的每个元素实施相同的操作 lappy(1:4,rnorm) 两个数据框的连接 #inner_join：取交集 #full_join：全连接 #left_join：左连接 #right_join

3587 1

每天 5 分钟，轻轻松松上手 R 语言（七）

今天的我们继续来看 dplyr 的 arrange 和 mutate。...arrange 行排序我们想按 sleep_total 降序排列行，可以使用 desc 函数; msleep %>% arrange(desc(sleep_total)) %>% glimpse()...83 Variables: 1 $ newcol 11.1, 16.0, 13.4, 13.9, 3.0, 13.4, 7.7, 6.0, 9.1, 2.0, 4.3, 8.4… 如果我们想对所有变量都进行相同的变换...in .Primitive("round")(name) : non-numeric argument to mathematical function 我们可以用 mutate_if 加一个判断条件...mutate_at,比如我们想把包含 sleep 的列都乘以60，即用分钟来表示时长； msleep %>% + mutate_at(vars(contains('sleep')),~(.*60

6611 0

使用 R 语言从 PDF 文档中提取表格

由于一个知识星球的小伙伴急需学习如何从 PDF 文档中提取表格，所以先插这个课，「使用 R 语言处理 netCDF 数据」系列的课程下次再发新的哈。...本课程介绍了如何使用 R 语言从 WHO（世界卫生组织）的官网上下载新冠疫情的每日报告以及如何从这些报告中的表格里面提取数据。...从 PDF 里面提取表格数据我选择最新的一个 PDF 做演示：20200523-covid-19-sitrep-124.pdf，下面使用 tabulizer 包进行数据提取，不过这个包依赖于 rJava...因为电脑系统的关系，我不好演示，大家可以自己研究下，不难的。我这里提供几个 tips，Java 安装之后可能还需要进行环境变量的配置。...", "Days_since_last_reported_case")) %>% mutate(Reporting_Country_Territory_Area = case_when

3.7K1 0

生信马拉松 Day22 TCGA实践

今天的主要内容是讲TCGA特有的数据分析内容肿瘤专属的知识笔记：1、TCGA的tumor和normal是表达数据里自带的，因此不需要特地下载临床信息，但是如果需要筛选样本，如特定的癌症亚类或相关的信息就需要临床信息...、突变数据的处理：其实是外显子组的下游分析，每一个基因在每个病人的哪个位点上发生了变化，突变频谱图泛癌比较复杂，一般的电脑不能使用xena（尚未更新）是2019年的基因版本，与现在有一定的出入，但也能用没有正常样本怎么做差异分析...#一个按条件筛选的小技巧library(dplyr)#创造一个数据，这是我自己搞的data = data.frame(gene1 = rep(c('Negative','Positive'),each=...3), gene2 = rep(c('Negative','Positive'),times=3))#写上条件k1 = data$gene1=='Negative'&data...$gene2=='Negative'k2 = data$gene1=='Negative'&data$gene2=='Positive'case_when(k1~'Type1', k2

2803 0

R海拾遗-tidyverse

# 去掉没用的 my_data2 % select(-Species) # 对所有的列进行筛选 my_data2 %>% filter_all(all_vars(.> 2.4...3.6 1.4 0.2 setosa ## 6 5.4 3.9 1.7 0.4 setosa # 对单一变量去重...3.6 1.4 0.2 setosa ## 6 5.4 3.9 1.7 0.4 setosa # 对多个变量去重...R基础功能 names(my_data)[names(my_data) == "Sepal.Length"] <- "sepal_length" 计算新变量 # 使用mutate my_data , Petal.Length_cm , ## # Petal.Width_cm # 对特定的变量计算

1.2K1 0

生信技能树- R语言-day7

多次赋值，会产生多个中间的变量x1 = select(iris,-5)x2 = as.matrix(x1)x3 = head(x2,50)pheatmap::pheatmap(x3)2....select(iris,-5)),50))管道符号传递，简洁明了iris %>%select(-5) %>%as.matrix() %>%head(50) %>%pheatmap::pheatmap()玩转条件和循环条件...else2， ifelse（，，ifelse）在ifelse里加一个ifelse补充 case_when练习题1.加载deg.Rdata,根据a、b两列的值，按照以下条件生成向量x：load("deg.Rdata...= iris[,5])}#批量装包pks = c("tidyr","dplyr","stringr")for(g in pks){if(!...对列表/向量中的每个元素实施相同的操作lapply(1:4,rnorm)两个数据框的链接merge可以合并inner_join:交集都存在的取inner_join(test1,test2,by="name

1040 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

数据处理第2节：将列转换为正确的形状

R语言第二章数据处理⑤数据框列的转化和计算目录正文

「R」dplyr 列式计算

R语言专题3-条件和循环

Python & R 控制流大比拼！建议收藏！

R&Python Data Science 系列：数据处理（2）

R语言批量生成CaseWhen的解决方案

生信马拉松 Day7

Day07 生信马拉松-数据整理中的R

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

R tips：使用TCGAbiolinks包下载TCGA数据

70-R茶话会15-你的编程菜鸟路上缺失的一课

大更新，pandas终于有case_when方法了！

tidyHeatmap使用长数据绘制热图

R语言基础5（绘图基础）

每天 5 分钟，轻轻松松上手 R 语言（七）

使用 R 语言从 PDF 文档中提取表格

生信马拉松 Day22 TCGA实践

R海拾遗-tidyverse

生信技能树- R语言-day7

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐