我有一个像这样的数据框:
x <-
id1 id2 val1 val2 val3 val4
1 a x 1 9
2 a x 2 4
3 a y 3 5
4 a y 4 9
5 b x 1 7
6 b y 4 4
7 b x 3 9
8 b y 2 8
我希望通过id1 & id2来汇总上面的内容。我希望能够在同一时间获得val1,val2,val3,val4的手段。
我该怎么做呢?
这是我目前拥有的,但它只适用于1
我有一个df,其中包含给定年份的球员,并在一列中显示了他们的统计数据。在某些情况下,我有多个相同球员的条目(他们是同一个人,只是在不同的联盟中完成了工作)。我想创建一个额外的df,它汇总了这些更详细的表,还将这些相同的球员行与每个联赛中比赛数量加权的平均值结合在一起。 现在,我可能在给定年份的df中有两行,如下所示: Name GP League Value
Helge Grans 23 SHL 5
Helge Grans 32 Allsvenskan 3 但我希望新的
假设我有如下数据
date value location
1/1 10 A
1/2 15 A
1/3 20 A
2/1 15 A
2/2 10 A
2/3 5 A
2/4 12 B
2/5 15 B
2/6 5 B
2/7 20 A
我想按位置汇总1/31之后所有超过10的值的计数。因此,我的输出将为位置A提供3,为位置B提供2。您知道如何在R中实现这一点吗?
我需要一些帮助,按组计算符合特定标准的观察值。首先,我希望将按位置划分的雇员数量作为一列。然后,我想检索工作超过40小时(按位置)的员工数量,并将其汇总到一个列中。我假设有一个简单的方法可以用dplyr或base R来完成,但是我被难住了。我的数据如下。 name hours_worked location
Bob 55 IL
Nick 25 IL
Sally 30 IL
Patricia 50 WI
Tim 35
我希望聚合我的数据库,包括分类变量,以便每行表示来自原始数据的多个行(例如,基于学生ID)。每个列都需要保存原始数据中最常见的值(每个聚合ID)。示例:我希望按学生汇总数据,并查看最常见的分类变量级别--例如:
student class
a h (being h the dominant level for the variable "class"
我在R工作室工作
我正在尝试对一个分类变量--脆弱分数执行group_by汇总。数据的结构使得每个对象都有多个观察值,其中一些包含丢失的数据,例如
Subject Frailty
1 Managing well
1 NA
1 NA
2 NA
2 NA
2 Vulnerable
3 NA
3 NA
3 NA
我希望将数据汇总,以便如果有可用的描述,则显示脆弱描述,如果没有,则显示NA。
Subject Frailty
1 Managing well
2 Vu
在不使用联接或合并的情况下,我想在这个表中添加一个mean(metric)列,它将metric按sector平均
symbol sector date_bom recommendation metric
A Strip Center 20XX-08-01 BUY 0.01
B Office Center 20XX-09-01 BUY 0.02
C Strip Center 20XX-07-01 SELL