开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

自定义函数中的dplyr group_by问题；与tidyeval有关？

自定义函数中的dplyr group_by问题是指在使用dplyr包中的group_by函数时，遇到自定义函数无法正确处理group_by的情况。tidyeval是tidyverse中的一组工具，用于处理非标准评估（non-standard evaluation）的问题。

在自定义函数中使用dplyr的group_by函数时，需要注意以下几点：

非标准评估：dplyr的group_by函数使用了非标准评估，即它可以接受变量名作为参数，而不是直接使用变量的值。这样可以在函数内部动态地生成group_by的参数。
引用变量：在自定义函数中，如果要引用group_by的变量，可以使用tidyeval中的enquo函数将变量转换为一个引用（quosure）。然后可以使用!!或quo_name函数将引用转换为变量名。
使用!!：在自定义函数中，可以使用!!操作符来解引用一个引用变量。例如，group_by(!!my_var)将解引用my_var并将其作为group_by的参数。

下面是一个示例代码，演示了如何在自定义函数中正确处理dplyr的group_by问题：

library(dplyr)
library(rlang)

my_function <- function(data, group_var) {
  group_var <- enquo(group_var)
  
  result <- data %>%
    group_by(!!group_var) %>%
    summarise(mean_value = mean(value))
  
  return(result)
}

# 使用示例数据框
df <- data.frame(group = rep(c("A", "B"), each = 5),
                 value = 1:10)

# 调用自定义函数
my_function(df, group)

在上面的示例中，my_function是一个自定义函数，接受一个数据框和一个group_var参数作为输入。在函数内部，首先使用enquo函数将group_var转换为引用变量。然后使用!!操作符解引用引用变量，并将其作为group_by的参数。

这样，即使在自定义函数中使用dplyr的group_by函数，也能正确处理group_by的问题。

关于tidyeval的更多信息和用法，请参考tidyeval的官方文档：tidyeval - Tidy evaluation

相关搜索:使用dplyr 1.0中的tidyeval一次总结多个函数如何使用group_by函数在dplyr中应用预先设计的函数将dplyr函数中包含group_by的函数应用于R中的datalist 使用dplyr中的group_by函数操作data.frame对象集 dplyr中group_by的另一个大数据问题编写一个自定义case_when函数，以便在使用tidyeval的dplyr mutate中使用 dplyr: summarize_at中的自定义函数带有dplyr的R中的自定义函数 dplyr:将所有列发送到group_by后面的变异体中的函数与静态成员函数一起使用时有关std：：函数的问题与polyfit和poly1d函数如何工作有关的问题使用dplyr中的group_by函数，有没有办法对单个变量的范围进行分组？将here()函数与dplyr管道操作中的map()集成与界面生成器中的“View as”有关的问题将自定义函数与dplyr摘要应用于许多独特的测量如何编辑依赖于plyr的自定义函数以与dplyr兼容？自定义函数在变异的dplyr中无法正常工作与水平滚动div中的动画有关的卡片间距问题与Caliburn事件有关的ToolbarTray工具栏中的按钮问题在dplyr问题中的变异调用中使用自定义case_when函数

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

「R」dplyr 编程

相反，它们捕获你键入的表达式并以自定义的方式对其进行计算。这让 dplyr 代码有两个主要优点：数据框的操作可以简洁地表达，因为你不需要重复输入数据框名称。...动词计算的参数来创建函数（这一点很重要，如果你使用 dplyr 进行数据框操作，会发现很好用，但是如果你用它创建函数，你会发现它总是以一种无法被理解的形式报错）。...[x == y, ] 这在交互式工作时非常有用（因为它可以节省打字时间和减少打字量，快速发现问题），但使创建函数比你想要的更不可预测。...这篇文章有两个目标：演示如何使用dplyr的pronouns和quasiquotation编写可靠的函数，以减少数据分析代码中的重复。...教你基本理论，包括quosures——一个存储表达式和环境的数据结构，以及tidyeval——底层工具包。

1.3K2 0

nextline函数_Java中的nextline（）函数与next（）问题

,不会读取\n，nextline();读入一行文本，会读入”\n”字符，但”\n”并不会成为返回的字符那么问题就在于for循环中的三个输入等待中，前两个是字符串(学校名称、校长姓名)最后一个是整型(建校时间...“跳过”的问题。...方案3：(可接收含空格的字符串，后文有说) 必要的知识： next();这个函数会扫描从有效字符起到空格，Tab，回车等结束字符之间的内容并作为String返回。...nextLine();这个函数在你输入完一些东西之后按下回车则视为输入结束，输入的内容将被作为String返回。...next();这个函数与之不同在于,next();什么都不输入直接敲回车不会返回，而nextLine()即使不输入东西直接敲回车也会返回。

9414 0

生信代码：数据处理（ tidyverse包）

在Rstudio中加载tidyverse包，可以看到该包下有8个子包，著名的ggplot2包即是其中的一个子集，我们先着重讲一下数据处理有关的包——dplyr包。...)——汇总数据而这些函数都可以与group_by结合，分组对原数据框进行处理。...1 mutate() mutate（）与基础函数transform（）相似，都可以添加新的一列，但是允许引用刚刚创建的列： mydata 中涉及到排序的包括 sort()，rank()，order()，而在dplyr包中与排序相关的是arrange()包，默认是从高到低进行排序，如果变换排序顺序则可以使用-(变量)或者desc(变量)。...() group_by可以对原数据框进行分组计算，例如对于我们本文中的数据框，我们如果对个人或者科目感兴趣的话，可以使用group_by（name或者type），然后利用summarize函数就可以求出分类之后的各个统计值

2.1K1 0

Day6生信入门—R包

下面以dplyr为例，学习R包安装和加载R包初级模式通过options()$repos检验升级模式为了保证可以自定义CRAN和Bioconductor的下载镜像，只需要运行这两行代码即可：...options函数就是设置R运行过程中的一些选项设置 options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源...options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源当然可以换成其他地区的镜像 BU这种方法还是有问题，下次再打开...") library(dplyr) 示例数据直接使用内置数据集iris的简化版: test <- iris[c(1:2,51:52,101:102),] dplyr五个基础函数注意，井号开头的是代码运行记录...表匹配的x表所有记录semi_join semi_join(x = test1, y = test2, by = 'x') ## 5.反连接：返回无法与y表匹配的x表的所记录anti_join anti_join

5442 0

左手用R右手Python系列6——变量计算与数据聚合

R语言与Python的Pandas中具有非常丰富的数据聚合功能，今天就跟大家盘点一下这些函数的用法。...transform(当然你可以选择使用自定义函数)，该函数支持基于同一个数据框新建多个变量。...library(dplyr) 使用group_by函数结合summarize可以方便的完成分组聚合功能。...ddply(.data, .variables, .fun =) #一般只需提供数据框，带聚合分类字段，以及最终的聚合函数与聚合变量公式。它的用法与内置的tpply用法如出一辙。...使用pandas中的groupby方法可以很快捷的进行分组数据聚合。

1.5K7 0

生信星球学习day6-毽子

R包学习1.镜像设置为了保证我们可以自定义CRAN和Bioconductor的下载镜像，其实是可以在Rstudio中进行设置的，只需要运行这两行代码即可：options("repos" = c(CRAN...> group_by(test, Species)图片summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))图片dplyr...full_join( test1, test2, by = 'x')图片4.半连接：返回能够与y表匹配的x表所有记录semi_join图片5.反连接：返回无法与y表匹配的x表的所记录anti_joinanti_join...(x = test2, y = test1, by = 'x')图片6.简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，而bind_cols...()函数则需要两个数据框有相同的行数

6340 0

dplyr数据处理

一、筛选过滤行 filter() filter()函数用于筛选出一个观测子集，第一个参数是数据库框的名称，第二个参数以及随后的参数是用来筛选数据框的表达式。...cyl == 6,mpg>21) dplyr::filter(mtcars,cyl == c(4,6),mpg>21) 二、排序 arrange() arrange()函数的使用方法与 filter...另外，当想要把几个需要的列移到前面，可以配合使用 everythins()函数，将剩余的列添加到后面。.../People) 七、统计使用 summarise()可以对每一列单独进行计算，例如求和，求平均值等，这些都可以使用apply 系列函数来完成，summarise()一般都配合 group_by...分组统计：group_by()函数与 summarise()配合一起使用，可以进行分组统计。

1.5K1 0

从头学R语言——DAY 3

包dplyr作为tidyverse中的核心包之一，主要用于数据转换。...此处先掌握dplyr的5个基本函数：mutate()，select()，filter()，arrange()，summaries()；1个重要的管道工具%>%#用dplyr包进行数据转换#5个核心函数test...(test, Sepal.Length) #默认从小到大排序arrange(test, desc(Sepal.Length)) #用desc从大到小#summaries()，汇总，通常与group_by...的平均值和标准差group_by(test, Species)summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length)...date：日期型变量深刻感受不同连接的区别存疑问题☆尚有疑问：count(test,Species)现error，如何实现应有作用？

841 0

懒癌必备-dplyr和data.table让你的数据分析事半功倍

dplyr很庆幸，都提供了关于常用方法的一些函数。...mutate( ) 为数据增加新列 mutate(df,vnew1=v1-v2,vnew2=vnew1+v3) 与基础包里的transform()函数接近，但mutate可以使用你刚刚创建的column...看了以上这几个函数，是不是觉得dplyr包超简单！...找到合适的packages并学习使用它，绝对会让我们数据分析工作事半功倍！我们有没有发现dylyr包中函数使用的一些规律？有的！...官网上面有关于data.table包对于dplyr的提升和改进： ?

2.5K7 0

R语言基于dplyr实现数据快捷操作

R语言在处理大数据方面一直是被人诟病的地方，那么有人就为R语言打造了一个dplyr包可以实现高效的数据预处理，减少内存的消耗，提升处理效率。今天就给大家详细看下这个包的具体功能。...首先看下包的安装： install.packages("dplyr") 接下来我们看下具体的功能： 1. as_tibble 将大的数据转化为友好展示的格式。...4. filter 匹配对应行的数据。并生成结果。等同于subset函数。...可以直接填入变量名，也可以直接用列号，或者更深一层添加功能函数：start_with(以什么开头的变量)，where（什么要求的变量）实例： iris %>%select(starts_with("Petal...最后我们看下更高级的应用实例： ###自定义函数在通道中的应用 var_summary <- function(data, var) { data %>% summarise(n = n(),

1.5K4 0

R||R语言基础（三）_R包

#务必要打引号 02 R包的调用/加载 library(dplyr) 或require(dplyr) #这里不用引号部分人可能会因为镜像的问题失败，解决方法https://mp.weixin.qq.com...dplyr五个基础函数 1. mutate() 增加列 mutate(test, new = Sepal.Length * Sepal.Width) #增加名为“new”的一列 2.select...group_by(test, Species) #按照Species分组 # 先按照Species分组，计算每组Sepal.Length的平均值和标准差 summarise(group_by(...4.semi_join 半连接:返回能够与y表匹配的x表所有记录semi_join(类似于excel中的vlookup函数) semi_join(x=test1,y=test2,by='x') 5....+命令 #搜命令帮助文档 help(package='R包') #搜R包帮助文档如果你能独立处理这些问题，那么恭喜你，你的R应该没问题啦！应该没问题了！！！！吧？

3.4K5 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

，后续的参数是条件，这些条件是需要同时满足的，另外，条件中取缺失值的观测自动放弃，这一点与直接在数据框的行下标中用逻辑下标有所不同，逻辑下标中有缺失值会在结果中产生缺失值。...2.2 sample_n dplyr 包的 sample_n(tbl, size) 函数可以从数据集 tbl 中随机无放回抽取 size 行，如: > d.class %>% sample_n(size...) rename() 这个函数可能出现在其它包中，保险起见写成 dplyr::rename()。...2.11 处理关系数据参见：中的join 函数介绍部分 2.12 数据框的列拆分与合并参见：34....dplyr 包的 summarse_at() 函数可以指定一批变量名与一批统计函数，自动命名结果变量，如: d.cancer %>% summarise_at( c("v0", "v1"), list(

10.9K3 0

学习R包

dplyr包有很多函数，为了防止dplyr包中的函数名与其他函数产生冲突，使用时前面加上“包名::”dplyr五个基础函数mutate(),新增列select(),按列筛选按列号筛选注意筛选内容与表格内容的统一...Sepal.Length的平均值和标准差group_by(test, Species)summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length...，Semi-Join会返回外表中的记录。...但即使在内表中找到多条匹配的记录，外表也只会返回已经存在于外表中的记录。...注意返回的表的不同反连接：返回无法与y表匹配的x表的所记录anti_join注意返回的表的不同简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同

1231 0

R入门？从Tidyverse学起！

这种入门的学习路径属于base R first，学习的流程基本是先了解变量的类型、数据的结构，再深入点就会学到循环与自定义函数。...(处理因子问题) tidyverse的安装也很简单，在R中输入以下命令： #安装包 install.packages("tidyverse") #使用前，记得载入包 library(tidyverse...dplyr包 dplyr基本包含了我们整理数据的所有功能，堪比瑞士军刀，这里介绍以下函数： filter: filters out rows according to some conditions （...5. summarise & group_by group_by通常与summarise搭配使用，如果我们需要对不同species的数据计算均值，那么利用group_by指定需要分组的列，summarise...同样，也可以与tidyverse中的管道和group_by结合，批量的做回归分析，并且得到整理好的结果。 ? ?

2.6K3 0

sparksql udf自定义函数中参数过多问题的解决

在进行spark sql数据库操作中，常常需要一些spark系统本身不支持的函数，如获取某一列值中的字符串。如要获取　“aaaakkkkk”中的第4－第8个字符。...才发现这里面由于UDF的原因，在任何函数中这个数字本身是不认的，因此需要加上lit()的命令才可以。

1.8K10 0

常用R包-dplyr

dplyr是一个在R语言中非常流行的数据处理包，它提供了许多功能强大且易于使用的函数，包括 select、 filter、mutate、arrange和summarize 等。...这些功能使得dplyr成为数据清洗、处理和分析的首选包。...计算每组Sepal.Length的平均值和标准差 group_by(test, Species) summarise(group_by(test, Species),mean(Sepal.Length)...表匹配的x表所有记录semi_join semi_join(x = test1, y = test2, by = 'x') （5）反连接：返回无法与y表匹配的x表的所记录anti_join anti_join...(x = test2, y = test1, by = 'x') （6）简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，而bind_cols

3691 0

Python从零开始第三章数据处理与分析python中的dplyr（5）目录

目录第二章（pandas） Python从零开始第三章数据处理与分析python中的dplyr（1） Python从零开始第三章数据处理与分析python中的dplyr（2） Python从零开始第三章数据处理与分析...python中的dplyr（3） Python从零开始第三章数据处理与分析python中的dplyr（4） Python从零开始第三章数据处理与分析python中的dplyr（5） ==========...中列的汇总函数。...summarize() 可以很好的搭配group_by函数 diamonds >> group_by('cut') >> summarize(price_mean=X.price.mean(),...lead（series，n）函数向上推动向量中的值，在末尾位置添加NaN值。

9823 0

Day6-橙子

R包本文内容均来自花花老师生信星球学习小组R包是多个函数的集合，具有详细的说明和示例。...Biocductor的limma包加载加载R包的两个函数library和require二者均可library(dplyr)安装加载三部曲R包使用流程：先安装后加载，然后才能使用包里的函数options(...")#安装library(dplyr)#加载dplyr示例数据使用内置数据集iris的简化版赋值给变量testtest dplyr五个基础函数...表匹配的x表所有记录semi_joinanti_join(x = test2, y = test1, by = 'x') #反连接：返回无法与y表匹配的x表的所记录anti_join#简单合并:在相当于...base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，而bind_cols()函数则需要两个数据框有相同的行数test1 <- data.frame

1151 0

【R语言】dplyr对数据分组取各组前几行

然后取每一个组的前10个条目或者前5个条目来绘制柱形图或者气泡图。那么问题来了，如何分组取前几行。今天小编就跟大家分享一个专业处理数据框的函数dplyr。...("dplyr") #加载dplyr包 library(dplyr) 我们先来看看直接head的效果 #直接head，结果不对 GO_result %>% group_by(ONTOLOGY) %>...top_n这个函数来输出每个组的前五行，wt是排序的依据，根据校正之后的p值来排序，n=-5是按从小到大排序。...会根据指定的p.adjust有小到大排序，然后取每组前5行方法五、使用group_modify结合head #使用group_modify r5=GO_result %>% group_by(ONTOLOGY...filter(row_number() <= 5) r6 通过filter来控制行数<=5 最后我们来看看这六种方法得到的结果究竟是不是一样的，dplyr这个包里面有函数叫all_equal专门用来判断两个数据框是不是一样的

1.9K2 1

R语言数据处理：飞机航行距离与到达延误时间有什么关系??

本文试图通过一个案例，对神奇的dplyr包的一些常用功能做简要介绍。在此抛砖引玉，欢迎广大盆友拍砖。先放上实践课的一个问题：航行距离与到达延误时间有什么关系??...带着这个问题，我们将首先使用dplyr包对给出的航班数据进行处理。...包，该软件包中的飞机航班数据将用于本文中dplyr包相关函数的演示。...3.1 数据分组 dplyr包里的分组是由group_by()函数实现的，脚本输入代码： by_dest group_by(myFlights, destination) class(by_dest...3.2 应用函数及组合结果我们使用dplyr包中的summarize()函数，进行数据统计指标的获取及组合。计算出不同目的地的平行航行距离以及平均延误时间。

3.1K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭