使用dplyr比较组和过滤常见观察值

、、

"759047198", "759047198", "759047198"))我运行以下代码来创建组- group_by(ISIN, YEAR) %>% GROUP_ID = cur_group_id20462211719 4 10 10 US98981710~ 2009 James (Jim) M Weber 3581636

浏览 3提问于2021-03-03得票数 0

回答已采纳

4回答

分组dataframe (dplyr) R中每个元素大于或等于的值之和

、、

我有一个相对较大的dataframe (大约2,000,000行)，其中，对于每一行，我需要在该观察的组内，计算大于或等于当前行值的每个值的和。data.frame( value = c(10,12,14,12,8,8,21,10)我目前有一个非常慢的解决方案来完成这个使用循环和一些过滤我一直在尝试使用dplyr，但是，我不知道如何在数据分组

浏览 1提问于2018-03-22得票数 10

回答已采纳

1回答

在R中使用dplyr进行过滤时返回整组

、

如果一个小组的观察至少有一个符合过滤标准，我想返回该小组内的所有观察结果。 test <- data.frame('prod_id'= c("s

浏览 0提问于2019-01-22得票数 0

回答已采纳

1回答

如何在R中使用filter和str_detect筛选部分匹配对的数据？

、、、

我正在尝试筛选具有匹配组的数据，如果它们没有匹配组，我希望删除这些观察值。#9 pear_1 A small#11 pear_3 A small 在这里，我决定每个苹果观察值必须通过它们的编号与每个观察值配对因此，我们可以看到，由于只有一个pear_2观察值，因此应该删除其中一个apple_2观察</e

浏览 25提问于2021-06-03得票数 0

回答已采纳

3回答

计算组内观测值之间的最小距离

、

在下面的数据集中，我如何创建一个新的列min.diff，为给定的观察x报告x与其组内任何其他观察y之间的最小距离(由group列标识)？我想用abs(x-y)测量x和y之间的距离。7 25 B 2 17 C 2 1 8 C 3 1 我更喜欢使用dplyr的解决方案。在我的脑海中，唯一的方法是通过添加更多的行来扩展数据帧，以获得组内的

浏览 36提问于2020-07-10得票数 0

回答已采纳

1回答

到目前为止，这是我最好的尝试，但它只计算了一个值，其余的都是NA的。dplyr::mutate(dummydata, newtimeseries = ifelse(date > date_to_start_interp, dplyr::lag(value_to_interp, 1) * (value_to_use/ dplyr::lag(value_to_use, 1)), value_to_interp))category：观测集的分组变量 date：观测的日期value_to_interp：需

浏览 4提问于2020-02-05得票数 0

1回答

在dplyr中嵌套过滤器

、、、

我正在尝试首先过滤一个观察值，然后使用该观察值进一步过滤数据。正则表达式： nm = LETTERS[seq( from = 1, to = 20 )],vl = rnorm(20, 100, 1)我已经完成了两个步骤，第一步是过滤观察<

浏览 10提问于2020-02-06得票数 0

回答已采纳

1回答

如何过滤组内和另一个(参考) `data.frame`中的观测结果

、

我希望过滤掉我的数据中的观察，它是基于一个单独的表，基于一个组的某些值。我还试图专门使用dplyr，而我已经使用data.table执行了类似的任务，我根本不知道如何完成它。table ip = c("255.255.255", "120.120.120")) 过滤后199.199.99

浏览 0提问于2019-02-05得票数 0

0回答

基于DPLYR中观测值样本百分比的滤波

、

对于每个样本，有多个观察值。不是所有的样本都有相同的观察结果。我想对这个表进行过滤，以删除值>x且在>y%的样本中观察到的观测值。例如，我有带观察值的样本。我希望筛选出得分>5的观察值，但前提是观察值出现在> 75%的样本中。1天的观察值，因为它发生在得分> 8的所有样本中。没有其他观察<

浏览 1提问于2017-11-29得票数 0

回答已采纳

0回答

使用dplyr计算样本之间共享观测值的数量

、、、

我有一个按样本分组的观察列表。我想找出与观察结果最一致的样本。相同的观察值是指两个样本之间的开始和结束编号都匹配。如果可能的话，我想使用R，最好是dplyr来做这件事。我已经习惯于使用dplyr进行更简单的数据处理，但这项任务超出了我目前的能力范围。我一直认为解决方案包括将开始和结束分组为单个变量:group_by(开始，结束)，但我还需要保留有关每个观察值属于哪个样本的信息，并在

浏览 0提问于2017-06-07得票数 0

回答已采纳

3回答

删除每个组的第一行

58 4 3510 4 6012 5 5 我想删除每个组的第一行

浏览 1提问于2015-08-19得票数 3

3回答

相对于“基线”组，对所有组进行分组操作，并进行多次观察

、、

从包含每个组的多个观察的数据开始，如下所示：my.df <- data.frame( counts我需要将timepoint == 0的计数向量和组的计数向量(例如timepoint == 0)传递给任意函数。NonsenseFunction <- function(x, y){} 我可以从这个表中获得所需的输出，无

浏览 0提问于2016-09-08得票数 1

回答已采纳

3回答

Dplyr过滤多个Like条件

、、

我正在尝试在dplyr中做一个过滤器，其中一列就像是某些观察值。我可以使用sqldf作为 Where SOURCE LIKE '%ALPHA%'OR SOURCE LIKE '%BETA%' 我尝试使用以下不返回任何结果的代码： d

浏览 1提问于2017-11-01得票数 1

3回答

group_by并保留所有不包含特定值的组，并筛选有特定值的组

、、

-01-05", ) ) 我想对变量Code应用dplyr::group_by，并过滤出特定值" Yes“和最小Date，但我想保留不包含Yes值的组的所有观察值。

浏览 65提问于2021-05-07得票数 3

回答已采纳

1回答

在LR中解释变量比观察值更多的情况下，SPSS如何排除变量

、、

我正在使用SPSS做几次线性回归，每次都应用不同的过滤器，以便比较不同的组。对于许多过滤器，我只用13个观察值来拟合回归，但有15或24个解释变量。请不要评论，只告诉我在13个观察值上拟合回归是愚蠢的。如果你有一些有用的见解，需要你首先指出13个观察值的回归不太理想，我很乐意听你说完。

浏览 10提问于2016-09-16得票数 0

回答已采纳

1回答

如何在指定数值变量精度的同时，使用` `dplyr::distinct()`在数据框中保留唯一行？

、

下面是一个仅使用dplyr::distinct()保持基于Sepal.Length列的唯一行的示例。我不想让dplyr::distinct()进行精确的比较，而是希望提供偏差的数值精度水平，比方说10%。例如，下面显示的Sepal.Length变量的前两个观察值分别显示了5.1和4.9。因此，根据10%的标准，这两个观察结果应该被认为是相等的，因为3.9% <10%。那么，有没有一种既简单又得体的方法呢？我的意思是，不需要显式地让我为每个感兴

浏览 11提问于2021-08-04得票数 2

9回答

从分组数据中选择第一行和最后一行

、

问题给定一个数据帧 stopId=c("a","b","c","a","b","c","a","b","

浏览 38提问于2015-07-21得票数 169

回答已采纳

3回答

执行select的正确R查询是什么？

、、

我希望选择total[,3] >=0.7和total[,4] <= 0.3的行数。nrow(total[,3]>=0.7 & total[,4]<=0.3) 我哪里出问题了？

浏览 4提问于2014-05-22得票数 0

回答已采纳

3回答

Dplyr -保留n个最大的组

、

如何使用dplyr过滤n中最大的观察值分组？我能做到..。

浏览 0提问于2020-10-22得票数 1

1回答

dplyr:计算汇总组之间的百分比变化

、、

我试图计算各组之间的百分比变化，使用一个控制和几个治疗，在我的data.frame中组织成组。由于我有很多观察，所以我正在使用dplyr。我不明白的是，如何有效地设置哪一组比较呢？通常，我会将此任务分成多个步骤：计算控制和处理之间的%变化。然而，我想知道，dplyr是否已经有了一种简单明了的方法？&qu

浏览 2提问于2021-07-31得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

分组dataframe (dplyr) R中每个元素大于或等于的值之和

在R中使用dplyr进行过滤时返回整组

如何在R中使用filter和str_detect筛选部分匹配对的数据？

计算组内观测值之间的最小距离

用另一列进行分组外推

在dplyr中嵌套过滤器

如何过滤组内和另一个(参考) `data.frame`中的观测结果

基于DPLYR中观测值样本百分比的滤波

使用dplyr计算样本之间共享观测值的数量

删除每个组的第一行

相对于“基线”组，对所有组进行分组操作，并进行多次观察

Dplyr过滤多个Like条件

group_by并保留所有不包含特定值的组，并筛选有特定值的组

在LR中解释变量比观察值更多的情况下，SPSS如何排除变量

如何在指定数值变量精度的同时，使用` `dplyr::distinct()`在数据框中保留唯一行？

从分组数据中选择第一行和最后一行

执行select的正确R查询是什么？

Dplyr -保留n个最大的组

dplyr:计算汇总组之间的百分比变化

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐