dplyr如何计算多列和自定义名称输出列的百分比

dplyr是一个R语言中用于数据处理和转换的包，它提供了一套简洁而强大的函数，可以对数据进行筛选、排序、分组、汇总等操作。在dplyr中，可以使用summarize()函数来计算多列的和，并使用mutate()函数来创建自定义名称的输出列。

要计算多列的和，可以使用summarize()函数结合across()函数。across()函数可以指定要应用操作的列，可以使用多个选择器来选择多列。以下是一个示例代码：

library(dplyr)

# 创建一个示例数据框
data <- data.frame(
  A = c(1, 2, 3),
  B = c(4, 5, 6),
  C = c(7, 8, 9)
)

# 使用summarize()函数计算多列的和
result <- data %>%
  summarize(
    across(
      .cols = c(A, B, C),  # 选择要计算的列
      .fns = sum  # 指定计算的函数，这里使用sum函数
    )
  )

print(result)

输出结果为：

  A  B  C
1 6 15 24

要创建自定义名称的输出列，可以使用mutate()函数结合rename()函数。mutate()函数用于创建新的列，而rename()函数用于重命名列。以下是一个示例代码：

library(dplyr)

# 创建一个示例数据框
data <- data.frame(
  A = c(1, 2, 3),
  B = c(4, 5, 6),
  C = c(7, 8, 9)
)

# 使用mutate()函数创建自定义名称的输出列
result <- data %>%
  mutate(
    CustomName = A + B + C  # 创建一个名为CustomName的列，计算A、B、C列的和
  ) %>%
  rename(
    `Custom Name` = CustomName  # 将列名CustomName重命名为Custom Name
  )

print(result)

输出结果为：

  A B C Custom Name
1 1 4 7          12
2 2 5 8          15
3 3 6 9          18

关于dplyr的更多信息和用法，可以参考腾讯云的R语言云函数（SCF）产品，该产品提供了一个无服务器的环境，可以在云端运行R语言代码。具体介绍和使用方法可以参考腾讯云的官方文档：R语言云函数（SCF）。

相关·内容

使用gtExtra美化表格

gt_sparkline 条形图 百分比条形图 百分比堆积条形图 win/loss plot 安装目前只能通过github安装。...，而这个函数可以只格式化一列的第一行，包括添加各种符号等，然后在其余行的最后添加空格，达到对齐的效果。...) image-20220514203205470 gt_merge_stack merge第1列和第2列，把第1列内容放在第2列的内容上面。...先计算好比例再通过gt_plt_bar_pct()函数画图： mtcars %>% head() %>% dplyr::select(cyl, mpg) %>% dplyr::mutate...首先要自己把比例算好，这个百分比需要由多列组成。

8042 0

R数据科学整洁之道：使用 tibble 实现简单数据框

tibble() 会自动重复长度为 1 的输入，并可以使用刚刚创建的新变量，如下所示： library(tidyverse) tibble( x = 1:5, y = 1, z = x ^ 2...可以在 tibble 中使用在 R 中无效的变量名称（即不符合语法的名称）作为列名称。例如，列名称可以不以字母开头，也可以包含特殊字符（如空格）。...dplyr 等其他 R 包中使用这些变量，也需要使用反引号。...data.frame 的使用方法主要有两处不同：打印和取子集。...除了打印列名，tibble 还会打印出列的类型，这项非常棒的功能借鉴于 str() 函数。

1.8K1 0

dplyr数据处理

一、筛选过滤行 filter() filter()函数用于筛选出一个观测子集，第一个参数是数据库框的名称，第二个参数以及随后的参数是用来筛选数据框的表达式。...另外，当想要把几个需要的列移到前面，可以配合使用 everythins()函数，将剩余的列添加到后面。...(starts_with('Pop')) %>% View() 五、抽样抽样的函数使用起来比较容易，可以按照个数抽样，也可以按照百分比进行抽样。...mtcars %>% dplyr::sample_n(10) mtcars %>% dplyr::sample_frac(0.2) 六、创建新变量有时需要对已有变量进行重新计算，例如计算几列的和.../People) 七、统计使用 summarise()可以对每一列单独进行计算，例如求和，求平均值等，这些都可以使用apply 系列函数来完成，summarise()一般都配合 group_by

1.5K1 0

数据处理|R-dplyr

select(iris,Sepal.Width,Petal.Length,Species) 其他特殊选择，可匹配： select(iris,contains("." )) #选取名称中含有字符的列区别...Width) #计算一个或多个新列并删除原列 6）数据汇总 summarize()函数实现数据集聚合操作，将多个值汇总成一个值 summarise(iris,avg = mean(Sepal.Length...Q：按品种分组，分别计算花萼宽度的均方差 summarise(group_by(iris,Species),sd=sd(Petal.Width)) 8）连接操作符 dplyr包里还新引进了一个操作符,%...抽样 sample_n()随机抽取指定数目的样本，sample_frac()随机抽取指定百分比的样本，默认都为不放回抽样，通过设置replacement =TRUE可改为放回抽样，可以用于实现Bootstrap...11）数据合并 dplyr包中也添加了类似cbind()函数和rbind()函数功能的函数，它们是bind_cols()函数和bind_rows()函数。

2K1 0

R语言数据框、矩阵、列表的创建、修改、导出

行名、列名)dim为维度，对数据框使用，输出(行数，列数)，nrow输出行数，ncol输出列数dim(df1)nrow(df1)ncol(df1)rowname输出行名，colname输出列名*注意没有...c(1,3),1:2] #取出第1、3行的1、2列数据，取多列的时候需要组织成合适的向量df1[,-ncol(df1)] #删去最后一列，"-"意义同向量列名或行名取子集df1[,"gene"] #取出列名为...$score > 0] #先取出列名为gene的向量，在给出一个一一对应的逻辑值向量数据框修改修改数据相当于定位取出数据后赋值，赋值需对应元素或向量df1[3,3] <- 5 #为第3行第3列数据赋值5df1df1...name，只取出列名有交集的merge(test1,test3,by.x = "name",by.y = "NAME") #test1与test3的共同列列名不一致，需要分别指出作为公共列的列名也可以借助...= ls())load(file = "soft.Rdata") #使Rdata中的向量出现在环境内，本身有名称，无需赋值矩阵和列表矩阵矩阵内所有元素数据类型必须相同*警惕因数据类型不同导致矩阵强制转换引起报错

7.8K0 0

使用R或者Python编程语言完成Excel的基础操作

数据格式设置：了解如何设置数据格式，包括数字、货币、日期、百分比等。条件格式：学习如何使用条件格式来突出显示满足特定条件的单元格。图表：学习如何根据数据创建图表，如柱状图、折线图、饼图等。...图表插入图表：根据数据快速创建各种类型的图表，如柱状图、折线图、饼图等。 自定义图表：调整图表样式、布局、图例等。文本处理文本分列：将一列数据根据分隔符分成多列。...自定义快捷键设置快捷键：为常用操作设置快捷键，提高工作效率。 自定义视图创建视图：保存当前的视图设置，如行高、列宽、排序状态等。...通过dplyr和tidyr包，我们可以轻松地对数据进行复杂的操作。在R语言中，即使不使用dplyr和tidyr这样的现代包，也可以使用基础包中的函数来完成数据操作。...，并且不如dplyr和tidyr这样的专用包那样直观和方便。

2171 0

R语言 | R基础知识

install.packages(c("ggplot2","dplyr")) 2加载包问题：如何加载一个已经安装了的包？方法：使用library()函数，括号中写上要加载的包名。...data <- read.csv("datafile.csv", head = FALSE) 想要手动为列名赋值，需要用到names()函数，括号中需写上文件的名称。...方法： readxl包中的read_excel()函数可以读取.xls和.xlsx等Excel文件。...自定义命名方法同上。 ③自定义列的类型默认情况下，read_excel()会自行判断每一列的数据类型。假如我们想要规定每一列的类型，可以使用col_types参数。...包中的filter()函数， #仅仅保留Expt为1的那些行，之后该结果传递给summary()函数计算统计结果 morley %>% filter(Expt ==1) %>% summary()

1.1K1 0

生信马拉松 Day7

，可以先写上数据集名称然后tab出列名，再删去数据框名字，防止写错 identical(a$Sepal.Length,test$Sepal.Length) #这个函数意思为是否相同，可以用来检查是不是真的排序了...条件和循环，if，for 碎碎念：这个东西每次好久不用就想不起格式要重新查，脑子是个好东西，就是漏的厉害 rm(list=ls()) #if的格式 if (){ #if后面的括号里只能是一个逻辑值...} 条件和循环的应用 #1.ifelse()+str_detect()，王炸组合，用来做grouplist samples = c("tumor1","tumor2","tumor3","normal1...ggplot2) p = ggplot(pdat,aes(gene,count))+ geom_boxplot(aes(fill = group))+ theme_bw() p TIPS 1.如何看某一列是否有重复值...2种方法 2.如何把数据框某列的“ ”转换为NA iris$Species[iris$Species=='']=NA 3.如何删除多余的信息 #这里示例数据中，a$tumor_stage.diagnoses

2500 0

R&Python Data Science 系列：数据处理（3）

###计算x、y、z的最大值和最小值 diamonds >> summarize_each([np.max, np.min], X.x, X.y, X.z) >> head(4) ?...R实现 ##计算钻石价格price的最大值、最小值 diamonds %>% summarise(price_max = max(price), price_min=min(price)) ###计算钻石...3.2 偏移函数两个偏移函数lead()和lag()： lead(column,n)：按照某种分组排序规则之后,向下取某列数据的第n行记录 lag(column,n)：按照某种分组排序规则之后...注意：Python中n()函数需要传入参数，R中不需要传入参数；Python中输出列按照字段名称升序排列，R中输出的列按照书写顺序输出。...5 总结数据处理1-3，主要介绍了Python中dfply和R中dplyr包中的数据处理函数，几乎满足数据预处理中筛选变量、衍生变量以及计算一些统计量的需求。

1.3K2 0

R语言入门（一）之数据处理

这两个部分将生信分析的绝大多数常用命令都讲到了，作为R语言入门是够用的，但是学海无涯，以此只是作为一个引子，想要进步还是要自己多学多练，举一反三才行。...b1=aggregate(a1air.hole, list(a1chemical), mean) #aggregate(需要被计算的内容，分类项，计算函数） aggregate(air.hole~chemical...#列的合并 d1$Quality = "NAU" #在d1数据后加一列，列的名称为Quality，内容均为"NAU" ?...d1group = paste0(d1Flower,"_",d1Quality, "=",d1 #在d1数据后加一列，列的名称为group，内容为每行的”Flower_Quality=Sepal.Length...d1condition = paste(d1Flower, d1 #在d1数据后加一列，列的名称为condition ，内容为每行的”Flower_Quality” ?

10.2K4 0

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多列执行相同的函数操作经常有用..._if, _at, _all 「dplyr」以前的版本允许以不同的方式将函数应用到多个列：使用带有_if、_at和_all后缀的函数。这些功能解决了迫切的需求而被许多人使用，但现在被取代了。...这是由 base R 提供的，但它并没有很好的文档，我们花了一段时间才发现它是有用的，而不仅仅是理论上的好奇。我们可以使用数据框让汇总函数返回多列。...我们可以使用没有外部名称作为将数据框列解包为单独列的约定。你如何转移已经存在的代码？

2.4K1 0

懒癌必备-dplyr和data.table让你的数据分析事半功倍

①第一个参数都是数据集df ②查询条件都是关于如何操作数据集的，在列上面进行操作 ③返回的都是新的数据集，不会改变原始数据集在介绍下一个包之前，我们先来引入一个dplyr包的综合运用： grouped...官网上面有关于data.table包对于dplyr的提升和改进： ?..."B")] 使用j DT[,v1] #选择v1列那如果我要选择多列呢，大家注意一下这里不是用c()来选取了，而是通过.()来选取，注意前面有一个”.”号，所以我说data.table的语法有点奇怪呢...(sum(v1),sd(v3))] data.table居然支持直接在j上进行列的计算，看到这里是不是觉得超牛逼，关键是代码非常简洁，一句话的事，就帮我们完成数据的筛选和计算了！ DT[,....(sum_v1=sum(v1),sd_v3=sd(v3))] 还可以直接给计算的列赋予名称哦！！功能强大得我都要笑开花了！使用by 这还只是小试牛刀，你忘了我们还有个by吗！！ DT[,.

2.4K7 0

R语言学习笔记之——数据处理神器data.table

R语言作为专业的统计计算语言，数据处理是其一大特色功能，事实上每一个处理任务在R语言中都有着不止一套解决方案（这通常也是初学者在入门R语言时，感觉内容太多无从下手的原因），当然这些不同方案确实存在着性能和效率的绝大差异...data.table 1、I/O性能： data.table的被推崇的重要原因就是他的IO吞吐性能在R语言诸多包中首屈一指，这里以一个1.6G多的2015年纽约自行车出行数据集为例来检验其性能到底如何，...注意以上新建列时，如果只有一列，列名比较自由，写成字符串或者变量都可以，但是新建多列，必须严格按照左侧列名为字符串向量，右侧为列表的模式，当然你也可以使用第二种写法。...自定义名称： mydata[,....以上语法加入了新的参数.SDcols和.SD,咋一看摸不着头脑，其实是在按照carrier,origin,dest三个维度分组的基础上，对每个子块特定列进行均值运算。

3.6K8 0

Magicodes.IE之导入导出筛选器

在本篇教程，笔者将讲述如何使用Magicodes.IE的导入导出筛选器。...导入列头筛选器，可以修改列名、值映射集合等等 IExporterHeaderFilter 导出列头筛选器，可以修改列头、索引、值映射等等导入结果筛选器（IImportResultFilter）的使用...导入结果筛选器可以修改导入结果包括验证错误信息（比如动态修改错误标注），非常适合对导入数据和错误验证内容进行二次动态加工，比如加入自定义校验逻辑、验证消息多语言翻译等等。...“Name”的列的列头修改为“Student” 将属性名称为“Gender”的列的列映射改为男女映射接下来我们继续编写导入逻辑： public async Task ImportHeaderFilter_Test...导出列头筛选器（IExporterHeaderFilter）的使用导出列头筛选器可以修改列头、索引、值映射，非常适合动态修改导出逻辑，比如列头的中英转换，值映射动态逻辑等等。

9952 0

day6-白雪

引用于微信公众号生信星球须知R包是多个函数的集合，具有详细的说明和示例。...) #dplyr下载的是一个安装包，解压在输，要不报错示例数据直接使用内置数据集iris的简化版:test select(test,c(1,5)) #筛选第一列和第五烈 Sepal.Length Species1...5.1 1.9 virginica> summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length)) #计算每组的...引用自微信公众号生信星球图片count统计某列的unique值计算数据对象（vector、dataframe）的unique独特值： unique函数从vector向量、dataframe 中删除重复项

9000 0

从头学R语言——DAY 3

包dplyr作为tidyverse中的核心包之一，主要用于数据转换。...此处先掌握dplyr的5个基本函数：mutate()，select()，filter()，arrange()，summaries()；1个重要的管道工具%>%#用dplyr包进行数据转换#5个核心函数test...(test,1) #类似向量提取元素，可以按位置和名称两种方式提取select(test,Species)#filter()，提取行filter(test,Species=='setosa')filter...Sepal.Length的平均值和标准差# 先按照Species分组，计算每组Sepal.Length的平均值和标准差group_by(test, Species)summarise(group_by(...date：日期型变量深刻感受不同连接的区别存疑问题☆尚有疑问：count(test,Species)现error，如何实现应有作用？

841 0

「R」用purrr实现迭代

d = rnorm(10) ) 如果想要计算每列的均值，我们使用for循环完成任务： output = vector("double", length(df)) for (i in seq_along...output[[i]] = mean(df[[i]]) } output #> [1] 0.45635 -0.17938 0.32879 0.00263 然后我们可能意识到需要频繁地计算每列的均值...for ( i in seq_along(df)) { output[i] = mean(df[[i]]) } output } 然后我们觉得可能还需要这样计算每列的中位数和标准差...哎呀，我们又复制粘贴了2次代码，因此是不是该思考下如何扩展一个代码让它同时发挥几个函数的功能呢？这段代码的大部分是一个for循环，而且如果不仔细很难看出3个函数有什么差别。...keep()和discard()函数可以分别保留输入中预测值为TRUE和FALSE的元素（在数据框中就是指列）： iris %>% keep(is.factor) %>% str()

4.8K2 0

Magicodes.IE之导入导出筛选器

在本篇教程，笔者将讲述如何使用Magicodes.IE的导入导出筛选器。...导入列头筛选器，可以修改列名、值映射集合等等 IExporterHeaderFilter 导出列头筛选器，可以修改列头、索引、值映射等等导入结果筛选器（IImportResultFilter）的使用...导入结果筛选器可以修改导入结果包括验证错误信息（比如动态修改错误标注），非常适合对导入数据和错误验证内容进行二次动态加工，比如加入自定义校验逻辑、验证消息多语言翻译等等。...“Name”的列的列头修改为“Student” 将属性名称为“Gender”的列的列映射改为男女映射接下来我们继续编写导入逻辑： public async Task ImportHeaderFilter_Test...导出列头筛选器（IExporterHeaderFilter）的使用 ? 导出列头筛选器可以修改列头、索引、值映射，非常适合动态修改导出逻辑，比如列头的中英转换，值映射动态逻辑等等。

8933 0

DAY6-学习R包

加载 library和require 使用一个R包需先安装再加载 library(dplyr）dplyr五个基础函数mutate(),新增列——mutate(test, new = Sepal.Length...*Sepal.Width)要修改的数据框的名称将创建的新变量的名称将分配给新变量的值select()按列筛选select(test,1)#筛选test中的第一列select(test,c(1,5))#筛选...test中的第一列和第五列select(test,Sepal.Length)#筛选test中名为Sepal.Length的一列按列名筛选select(test, Petal.Length, Petal.Width...))#用desc从大到小summarise()：汇总summarise(test, mean(Sepal.Length), sd(Sepal.Length))mean（）计算平均值sd（）计算标准差group_by...Sepal.Length的平均值和标准差并汇总dplyr两个实用技能管道操作 %>% —— 相当于将左边的作为右边函数的第一个参数，快捷键: ctrl+shift+M（不管用——改为Ctrl＋a） test

2313 0

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

（参考来源：R高效数据处理包dplyr和data.table，你选哪个？） ?...DT数据集按照x分组，然后计算v变量的和、最小值、最大值。（2）dplyr函数利用%>%（链式操作）来改进：链式操作是啥意思呢？...2、on=""方式 DT[X, on="x"] 这里的on指的是DT变量中的变量名称，X还是按照key，如果没设置就会默认第一行为key。...—————————————————————— 实战一：在data.table如何选中列，如何循环提取、操作data.table中的列？...dplyr和data.table，你选哪个？

8.6K4 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

dplyr如何计算多列和自定义名称输出列的百分比

相关·内容

使用gtExtra美化表格

R数据科学整洁之道：使用 tibble 实现简单数据框

dplyr数据处理

数据处理|R-dplyr

R语言数据框、矩阵、列表的创建、修改、导出

使用R或者Python编程语言完成Excel的基础操作

R语言 | R基础知识

生信马拉松 Day7

R&Python Data Science 系列：数据处理（3）

R语言入门（一）之数据处理

「R」dplyr 列式计算

懒癌必备-dplyr和data.table让你的数据分析事半功倍

R语言学习笔记之——数据处理神器data.table

Magicodes.IE之导入导出筛选器

day6-白雪

从头学R语言——DAY 3

「R」用purrr实现迭代

Magicodes.IE之导入导出筛选器

DAY6-学习R包

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐