腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
dplyr
汇总
一个
变量
并
计算
依赖于
其他
变量
的
另一个
变量
的
平均值
、
在下面的数据集中,我想要
汇总
城市和日期
的
租期,
并
另外
计算
平均持续时间grouped_by日期+城市。我想
使用
dplyr
,
并
尝试了以下方法: df <- df %>% summarise((rentals=sum(rentals)), duration=mean(duration)) 我最终只剩下一行,其中包含
汇总
的
租金和平均总持续时间。它似乎忽略了我
浏览 15
提问于2020-11-05
得票数 0
1
回答
总结具有相似但不相同
的
x值
的
变量
、
、
我有
一个
有三个重复
的
数据集。我想画出每个X
变量
的
平均Y
变量
。然而,我
的
x-值并不相同.下面是我
的
意思
的
一个
小例子:0 5 repeat10 5 repeat39.3 5 repeat19 5 repeat3 现在我希望有什么方法
浏览 2
提问于2020-04-15
得票数 1
回答已采纳
1
回答
用不同
的
函数概括许多
变量
、
我想为
一个
大数据框架
的
所有
变量
计算
和或
平均值
(或
其他
所有可能
的
汇总
)。如果可能的话,这应该只在
一个
管道中完成。据我所知,您只能
使用
sumarise(),以便为每个
变量
分别选择函数(例如,summarise(., mean_var1 = mean(var1), sum_var2 = sum(var2), ...)这将是很多打字
的
方法。另一方面,我认为summarise_each()可
浏览 6
提问于2016-07-05
得票数 1
回答已采纳
1
回答
dplyr
:组计数
的
平均值
、
、
我试图
使用
dplyr
在dataframe上找到
变量
的
平均长度: x <- data %>% group_by(Date, `% Bucket`) %>% summarise(count = n())在上面的每个桶中找到
的
计数,并将它们相加,除以包含该% Bucket
变量
的
行数,
并
给出上面的答案。不过,我如何
使用
dplyr
完成这一任务呢?这不是关于完成问题,而是理解在这种情况下如何
使用</em
浏览 4
提问于2015-12-30
得票数 3
回答已采纳
1
回答
通过R中
的
变量
传递值到函数
、
、
我有以下数据新
的
,而不是直接
使用
col1
的
均值函数,我想首先将col1保存到
一个
变量
,然后将该值传递给
平均值
。这是我想做
的
。<- df %>% summa
浏览 3
提问于2021-04-24
得票数 0
4
回答
按栏
汇总
:
平均值
和和
我试着按组总结
一个
变量
列表。有些
变量
需要求和,另一些则需要平均。10 22 6 7我想要
变量
1和
变量
2
的
平均值
:1 22 4我一直在用
dplyr<
浏览 3
提问于2020-03-12
得票数 2
回答已采纳
2
回答
如何根据R中
的
条件
计算
两行之间
的
观测值?
、
、
我正在尝试为数据框创建
一个
变量
,在该
变量
中,我
计算
满足标准
的
两个观测值之间
的
观测值
的
数量。这里是
计算
自上次在游戏中获胜以来
的
次数。假设我有
一个
这样
的
数据帧: df <- data.frame(player = c(10,10,10,10,10,10,10,10,10,10,10),win = c(1,0,0,0,1,1,0,1,0,0,1)) 我想创建
一个
新
的</em
浏览 32
提问于2021-04-22
得票数 0
2
回答
用惯用
的
dplyr
和/或data.table方法一步一步地得到组
的
意思和宏大
的
意思。
、
、
我同时
使用
dplyr
和data.table,所以我感兴趣
的
是是否有
使用
任何
一个
包
的
解决方案。 我通常希望用摘要统计来总结数据--比如说,为了示例--通过一些分组
变量
和整个数据集(大
平均值
)来总结数据。然后,我通常将它们组合成
一个
输出数据,以供显示,分组
变量
列中
的
大
平均值
行指定为“总计”或“总体”。以下是我通常是如何
使用
dplyr
和data.tab
浏览 3
提问于2022-04-01
得票数 1
回答已采纳
1
回答
是否有按国家和年份
汇总
单个级别数据
的
R函数?
、
、
我正在尝试对具有个人级别数据
的
长格式聚合数据集进行国家级(按年)摘要。我尝试
使用
dplyr
来
汇总
我感兴趣
的
变量
的
平均值
,以创建
一个
新
的
数据集。然而..。我
的
group_by似乎有问题,因为答案只是
一个
观察值,它似乎是每个观察值
的
平均值
。数据命名:"finaldata.giniE",国家
变量
:"iso
浏览 19
提问于2020-07-03
得票数 0
回答已采纳
2
回答
多
变量
自定义函数
、
我正在
计算
变量
对中后
的
平均值
。通过对中心,它意味着从其原始
变量
中减去
变量
的
平均值
。我
使用
的
是
dplyr
软件包。我可以通过mutate()函数对
一个
变量
执行此操作。如何
使用
变体对多个
变量
执行相同
的
操作?100,100),
浏览 8
提问于2017-04-06
得票数 2
回答已采纳
6
回答
使用
dplyr
创建通用描述符表
、
、
我正在尝试创建
一个
简单
的
代码,我可以重复
使用
这些代码(只要进行最小
的
调整),以便能够打印
一个
汇总
统计数据表。) %>% Mean = mean(V2) ) 我想修改这个函数,以便它
计算
数据集中所有
变量
的
M和SD我
的
愿望清单上有几件事: 给定
变量
的
M和SD应该相邻,我想在每对上
浏览 0
提问于2020-03-05
得票数 4
1
回答
如何根据分组数据框中
另一个
变量
的
条件从
另一个
变量
中返回值?
我正在
使用
基本
的
group_by() + summarize_at方法
计算
分组数据帧中一组
变量
中
的
每个
变量
的
一些指标。每个组代表
一个
小
的
时间序列。我要
计算
的
一个
指标是每个组中每个
变量
的
初始值(在本例中为day == 1)。因此,广义问题是在分组数据帧
的
组内,根据
另一个
变量
中
的
浏览 6
提问于2019-04-03
得票数 1
回答已采纳
1
回答
特定列
的
所有列
的
平均值
、
、
我有
一个
数据集,其中第一列是季度月份,第二列是年份,然后我有所有国家
的
一些数据(比如价格)作为
其他
列。76.2 76.43 67 12 2001 43.4 26.4 34.4 64.2 76.21 67 多年来,我在许多国家都有这些数据 我想创建
一个
数据集,给出每个国家每年
的
平均价格。它应该看起来像这样,每个国家在一年中
的
平均值
的
数据 Year Australia Austria
浏览 14
提问于2019-12-13
得票数 0
1
回答
group_by()和summarise()错误
、
、
我想通过函数group_by()和friend_count ()制作
一个
数据帧,其中包含来自
另一个
数据帧'pf‘
的
汇总
变量
的
平均值
和中位数。但是当我尝试这个命令时,结果如下所示,显示了整个friend_count列
的
平均值
和中位数,而不是按年龄分组。
浏览 4
提问于2018-07-17
得票数 0
1
回答
R:
使用
错误
的
dplyr
结果用不同
的
求和函数对多列进行
汇总
?
、
、
、
问题是,我不能简单地对所有列求和或求
平均值
,因为不是所有
变量
都可以以相同
的
方式聚合。例如,duration是我希望通过mean
汇总
的
变量
,而purchase_own是我希望通过sum
汇总
的
变量
。我
使用
dplyr
让它正常工作,但它给了我
一个
错误。现在我
的
问题是,我如何编写
汇总
函数,使求和对于某些
变量
是不同
的
? 实
浏览 22
提问于2019-04-23
得票数 0
1
回答
按组自动
计算
z-得分
、
、
我有以下数据框架:我想为每个物种做
一个
z评分,包括所有的
变量
。我可以手动地为每一行找到SD和
平均值
,
并
使用
适当
的
公式,但是我需要重复几次,并且希望找到一种更有效
的
方法。 我试过
使用
scale(),但无法弄清楚如何让它执行包含多个
变量
和分组
变量
的
逐
浏览 6
提问于2022-02-27
得票数 1
2
回答
如何
使用
dplyr
计算
两个分组
变量
的
加权
平均值
、
、
、
、
我知道这一定非常容易,但是我很难找到正确
的
dplyr
命令来完成这个任务。假设我希望将数据集按两个
变量
分组,然后
汇总
每一行
的
计数。为此,我们只需:这将为三个
变量
cyl、mpg和Count生成27行数据。接下来我要做
的
是总结三个cyl值中
的
每个值
的
平均cyl。请记住,每一行都可能包含
一个
大于Co
浏览 0
提问于2018-04-24
得票数 8
1
回答
如何在ggplot2中以每个
变量
作为条形图创建条形图?
、
、
、
、
我正在做
一个
蒙特卡罗模拟,它用8个数值
变量
的
10000个观测值来输出
一个
矩阵。我将
使用
dplyr
的
8个
变量
总结如下: V1 V2 V3 V4 V5 V6 V7 V8 <dbl> <dbl其中,第一行是每个
变量
的
平均值
,第二行是每个
变量
的
标准偏差。我如何
浏览 1
提问于2018-09-11
得票数 1
回答已采纳
1
回答
R
使用
dplyr
按组
计算
加权统计信息
、
几年来,我一直在
使用
Hmisc包和基数R来
计算
加权统计
汇总
。通常,我
使用
双倍权重,
一个
是空间影响权重,
另一个
是数据支持值,如长度、体积、物理密度等。以‘mtcar’数据集为例,其中mpg是感兴趣
的
变量
,而由car 'wt‘和'hp’设计
的
双倍权重,Hmisc + base R工作流程通常如下所示。然而,当我试图学习如何
使用
dplyr
时,我想知道如何
计算
这些加权统
浏览 9
提问于2021-07-24
得票数 2
回答已采纳
2
回答
按集合
计算
的
R组
、
、
我有
一个
CSV文件,其中包含以下数据:1 A 2010 4389 A5 E 2011 82 A
使用
R语言,我需要收集每个批次
的
学生分数
的
总和。我可以
使用
什么,因为卷取功能在R中不再可用?我真的不知道怎么开始。请帮
浏览 2
提问于2013-11-11
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言必学包之dplyr
R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据
加权到底是怎么回事儿?
Java中volatile的使用,只能保证变量的可见性,不能保证原子性
排序和去重 数据处理
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券