我有一个相对较大的dataframe (大约2,000,000行),其中,对于每一行,我需要在该观察的组内,计算大于或等于当前行值的每个值的和。data.frame( value = c(10,12,14,12,8,8,21,10)我目前有一个非常慢的解决方案来完成这个使用循环和一些过滤我一直在尝试使用dplyr,但是,我不知道如何在数据分组
我正在尝试筛选具有匹配组的数据,如果它们没有匹配组,我希望删除这些观察值。#9 pear_1 A small#11 pear_3 A small
在这里,我决定每个苹果观察值必须通过它们的编号与每个观察值配对因此,我们可以看到,由于只有一个pear_2观察值,因此应该删除其中一个apple_2观察</e
在下面的数据集中,我如何创建一个新的列min.diff,为给定的观察x报告x与其组内任何其他观察y之间的最小距离(由group列标识)?我想用abs(x-y)测量x和y之间的距离。7 25 B 2 17 C 2 1
8 C 3 1 我更喜欢使用dplyr的解决方案。在我的脑海中,唯一的方法是通过添加更多的行来扩展数据帧,以获得组内的