Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >数据集使用和变量选择

数据集使用和变量选择
EN

Stack Overflow用户
提问于 2020-05-03 04:10:20
回答 2查看 67关注 0票数 0

我上传了数据集。但我该如何向那些在欧洲死去的人展示。

df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19-timeseries/master/countryReport/raw/rawReport.csv')

europe <-- df[df$region =="Europe"]

df$death [europe]

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-05-03 10:49:16

我们也可以在subset中使用aggregate

代码语言:javascript
运行
AI代码解释
复制
aggregate(death~countryName, df, subset = region =="Europe"), sum)

或者使用rowsum

代码语言:javascript
运行
AI代码解释
复制
with(subset(df, region == 'Europe'), rowsum(death, countryName))
票数 0
EN

Stack Overflow用户

发布于 2020-05-03 04:42:05

我们只能过滤欧洲国家,并按国家计算死亡人数。

这可以在基础R中完成:

代码语言:javascript
运行
AI代码解释
复制
df1 <- aggregate(death~countryName, subset(df, region =="Europe"), sum)

dplyr

代码语言:javascript
运行
AI代码解释
复制
library(dplyr)
df1 <- df %>% 
        filter(region == 'Europe') %>% 
        group_by(countryName) %>% 
        summarise(total_death = sum(death))

data.table

代码语言:javascript
运行
AI代码解释
复制
df1 <- setDT(df)[region == 'Europe', (total_death = sum(death)), countryName]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61574213

复制

相似问题

闪亮,无法选择所选数据集的变量

119

跨数据集使用变量

11

声明变量集=选择

11

使用typedcolumn选择Spark数据集

23

基于变量的数据集的选择与聚焦

13
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文