奇怪的dplyr+NSE:在变异体内部的自定义函数中使用NSE

dplyr 是 R 语言中一个非常流行的数据操作包，它提供了丰富的函数来处理数据框（data frame）。NSE（Non-Standard Evaluation）是指非标准求值，在 dplyr 中，NSE 主要用于处理列名作为参数传递的情况。

基础概念

在 dplyr 中，使用 {{ 符号可以实现 NSE。这种语法允许你在函数内部动态地引用列名，而不是在函数调用时就确定列名。这在编写可重用的函数时非常有用，尤其是当你不知道列名会是什么时。

类型与应用场景

类型：NSE 主要涉及到如何在函数内部处理变量名。
应用场景：当你需要编写一个函数，该函数可以处理不同的数据框和列时，NSE 非常有用。例如，创建一个函数来计算任何给定列的平均值。

示例代码

假设你想创建一个函数，该函数接受一个数据框和一个列名，然后返回该列的平均值。使用 NSE 可以这样实现：

library(dplyr)

calculate_mean <- function(data, column) {
  data %>% summarise(mean({{ column }}))
}

# 使用示例
mtcars %>% calculate_mean(mpg)

在这个例子中，{{ column }} 允许 calculate_mean 函数接受任何列名作为参数，并在 summarise 函数内部动态地引用它。

遇到的问题及解决方法

如果你在使用 NSE 时遇到了问题，比如函数没有按预期工作，可能是因为以下原因：

列名错误：确保传递给函数的列名在数据框中存在。
语法错误：检查 {{ 符号的使用是否正确。
环境问题：确保函数在正确的环境中执行，特别是在使用闭包或嵌套函数时。

解决方法：

使用 rlang 包中的 sym 和 as_string 函数来检查和转换列名。
使用 debug 函数来逐步调试函数，查看每一步的执行结果。
确保你的 R 版本和 dplyr 包是最新的，以避免已知的 bug。

例如，如果你想确保传递给函数的列名是正确的，可以这样做：

calculate_mean <- function(data, column) {
  column_name <- rlang::as_string(rlang::sym(column))
  if (!(column_name %in% colnames(data))) {
    stop("Column not found in data.")
  }
  data %>% summarise(mean({{ column }}))
}

这样，如果传递了一个不存在的列名，函数会抛出一个错误，而不是默默地失败。

总之，NSE 是 dplyr 中一个强大的特性，它可以极大地提高代码的灵活性和可重用性。当遇到问题时，仔细检查列名和环境通常是解决问题的关键。

奇怪的dplyr+NSE:在变异体内部的自定义函数中使用NSE

、、

在dplyr::mutate的自定义函数中使用NSE时，我遇到了一个问题。v2) %>% eval.parent(n = 1) mutate( ) 在这里，f工作得很好，但是需要外部调用eval()来在mutate()环境中执行代码。这当然有点难看，并导致了大量的样板代码。完成这项工作的最佳猜测是ff，它试图在其调用环境中计算构造

浏览 0提问于2018-07-21得票数 0

回答已采纳

1回答

Swift结构等价于C++可变关键字？

、、

在swift中是否有与C++ mutable关键字等效的关键字？我有一个结构体，它实现了一个包含非变异函数的协议，但是这个实现在内部实现了变异内部状态。有没有办法通过这个函数使类的成员变量变得可变，而不改变协议定义，使函数成为mutatingpublic protocol P { // f is semantically un

浏览 5提问于2016-03-07得票数 0

1回答

在R中rms标号中不能使用非标准评价

、、、

上下文但是，当我使用NSE将代码包装到自定义函数中时，它会报告一个错误。问题我不知道为什么在自定义函数myfun中使用NSE来报告错误，以及如何修复这个错误。

浏览 6提问于2022-09-26得票数 0

2回答

遗传算法停止变异

、、

我目前正试图使我的遗传算法“生成”或“进化”到一个给定的单词。问题是，它从来没有完全达到这个词，它停留在一个过高的健康评分，即使它应该继续变异。以下是一个例子：后500代= "XelgoWorfd“

浏览 1提问于2017-05-11得票数 0

回答已采纳

2回答

如何将非标准的和标准的评估混合在相互作用的参数中(.)内部ggplot()？

、、、、

我正在寻找一种使用dplyr包在rlang包中使用NSE内部参数的方法(在本例中是intersect)。<- sym(d) 但是，当我使用我想原因可能是在嵌套的

浏览 0提问于2018-05-09得票数 2

回答已采纳

2回答

电动汽车配流的遗传算法技术

、

我试图解决的问题是关于电网中电动汽车(EVs)的最佳分配。我的网格有20个可能的位置(母线)，允许每个位置接收一辆电动汽车。每条染色体的长度为20，其基因可以是0或1，其中0表示没有EV，1表示在该位置(母线)存在EV。我从随机分配的固定数量的电动汽车(例如，5辆)开始我的种群(100个个体)。让它们通过我的GA进化。GA利用锦标赛选择、2点交叉和翻转位变异。每

浏览 3提问于2018-06-25得票数 0

1回答

用translate_sql()将字符命令转换为SQL

、

我有以下字符"column == 5"，我想将其转换为sql：column = 5。我该怎么做？translate_sql(eval(parse(text="column + 5")))我知道一定有什么诡计！

浏览 0提问于2016-08-09得票数 1

回答已采纳

2回答

我正在尝试理解如何使用遗传算法来解决工人的任务分配问题，正如一篇名为Solving Task Allocation to the Worker Using Genetic Algorithm的论文中所描述的那样作为一个例子，我有下面的表格，它代表了工人以及他们执行任务所需的时间。| 2 | 4 |4 | 7 | 1 | 8 | 9 | 2 | 5 | 3 | 2 | 6 | 1 | 8 | 问题涉及为每个任务选择执行任务最快的工人我读到过

浏览 58提问于2020-01-05得票数 0

回答已采纳

2回答

处理非法字符串的遗传算法

、

我正在尝试实现遗传算法来最大化n变量的函数，使得每个变量都在[-n, n]的范围内。现在的问题是在交叉和变异过程中生成非法值(大于2n)。一种方法是在交叉和变异过程中用合法的值替

浏览 0提问于2013-04-25得票数 0

1回答

XPATH查询、HtmlAgilityPack和提取文本

、、、

我一直试图从一个名为"tim_new“的类中提取链接。我也得到了解决办法。此外，我还想编写几行代码来提取针对NSE:编写的文本。<div clas

浏览 1提问于2010-06-06得票数 2

1回答

为什么R中的遗传算法没有指定的实际生成数

、、

我正在使用R的genalg库，并试图在运行二进制泛型算法时保存所有代。在库中似乎没有一种内置的方法，所以我试图通过评估函数保存每个染色体，x。为了测试这个方法，我尝试在评估函数中插入print(x)，以便能够看到所有被评估的染色体。然而，印刷染色体的数量并不总是与我所怀疑的相匹配。我以为印刷染色体的数量将等于群

浏览 6提问于2016-04-13得票数 0

回答已采纳

1回答

在python中，`for`...`if`表达式中的Class变量失败

、、

看下面这段简单的代码： numbers = [1, 2, 3] print(*(a for a in numberscopy))我在类中定义了numbers变量。然后，我可以使用它来做其他事情，比如制作一个副本，迭代它，并打印它的内容。但是使用for-if语句的最后一行<e

浏览 33提问于2019-05-14得票数 3

回答已采纳

1回答

理解什么时候在函数中使用ensym，sym和in。

、、、、

我试图把我的头脑围绕着不同的现状/不一样的语法，以及每种语法应该在什么时候使用。我编写的函数主要是传递要用作参数的数据和列--使用ggplot绘制或使用dplyr (group_by、汇总、变异等)汇总/操作数据。但是，有时我还必须在我的整体功能中使用一个不使用NSE的函数。据我所知，我<e

浏览 0提问于2020-01-27得票数 7

回答已采纳

1回答

如何使用hydroGOF包获得分组的纳什-萨克利夫效率？

、、

我正在尝试通过变量对NSE值进行分组。我尝试了类似的方法：library(hydroGOF) NSE(wt,drat) 为什么它不起作用？

浏览 28提问于2020-05-23得票数 0

回答已采纳

2回答

使用data = value获取所有元素

、、、

在我的JavaScript类中，我遇到了以下问题：jQuery(element).data("types", "row"); console.log(i, jQuery(e).data(), jQuery(e).attr("id")); // writes object{type:row}为什么使用这个

浏览 5提问于2014-12-10得票数 0

回答已采纳

2回答

是否可以在R中使用管道%>%运算符输入表达式？

、、

为什么管道操作符%>%在下面的代码中的第二个示例中不能工作？我不熟悉R中的表达式

浏览 10提问于2022-07-31得票数 0

回答已采纳

1回答

如何用自定义钩子传递响应查询中的参数？

、、

我使用的是自定义钩子的react查询。我不知道实施是否正确。我想要一些建议。) => {}; url: 'url', }); 一切

浏览 3提问于2022-04-08得票数 0

回答已采纳

1回答

用遗传算法搜索三维位置

、、、、

我有一个问题，我想用遗传算法，根据一些适应度函数，在3D空间中搜索最佳位置。因为我在寻找一个位置，我的染色体用3个浮点数来表示。在这样的交叉中，下一代将只包括在起始种群中具有类似X、Y或Z坐标作为染色体的位置。因此，不可能有太多的变化。我的问题是，对我的染色体使用另一个表示法是否能最好地解决这个问题(例如。因此，更多的<

浏览 1提问于2016-03-30得票数 3

回答已采纳

1回答

为什么在python中不在函数内部使用变量值

、

为什么下面的函数不接受函数体中定义的内部h值，并给出奇怪的结果(任意h值)？

浏览 15提问于2021-01-24得票数 0

回答已采纳

3回答

useState如何更新组件？

一开始，我认为react组件的函数体以某种方式侦听内部发生变化的任何内容，这就是它更新的原因。但是后来我尝试设置一个间隔，它会改变函数体中的一个变量，但它没有更新。一个很好的问题是，自定义钩子是如何工作的，因为它只是一个函数，它有一些值并返回它们，但能够更新函数组件。所以基本上的问题是: useState如何

浏览 15提问于2019-07-29得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

奇怪的dplyr+NSE:在变异体内部的自定义函数中使用NSE

基础概念

相关优势

类型与应用场景

示例代码

遇到的问题及解决方法

相关·内容

奇怪的dplyr+NSE:在变异体内部的自定义函数中使用NSE

Swift结构等价于C++可变关键字？

在R中rms标号中不能使用非标准评价

遗传算法停止变异

如何将非标准的和标准的评估混合在相互作用的参数中(.)内部ggplot()？

电动汽车配流的遗传算法技术

用translate_sql()将字符命令转换为SQL

遗传算法如何解决工人的任务分配问题

处理非法字符串的遗传算法

XPATH查询、HtmlAgilityPack和提取文本

为什么R中的遗传算法没有指定的实际生成数

在python中，`for`...`if`表达式中的Class变量失败

理解什么时候在函数中使用ensym，sym和in。

如何使用hydroGOF包获得分组的纳什-萨克利夫效率？

使用data = value获取所有元素

是否可以在R中使用管道%>%运算符输入表达式？

如何用自定义钩子传递响应查询中的参数？

用遗传算法搜索三维位置

为什么在python中不在函数内部使用变量值

useState如何更新组件？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐