腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >数据集使用和变量选择

问数据集使用和变量选择
EN

Stack Overflow用户

提问于 2020-05-03 04:10:20

回答 2查看 67关注 0票数 0

我上传了数据集。但我该如何向那些在欧洲死去的人展示。

df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19-timeseries/master/countryReport/raw/rawReport.csv')

europe <-- df[df$region =="Europe"]

df$death [europe]

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-05-03 10:49:16

我们也可以在subset中使用aggregate

aggregate(death~countryName, df, subset = region =="Europe"), sum)

或者使用rowsum

with(subset(df, region == 'Europe'), rowsum(death, countryName))

票数 0

Stack Overflow用户

发布于 2020-05-03 04:42:05

我们只能过滤欧洲国家，并按国家计算死亡人数。

这可以在基础R中完成：

df1 <- aggregate(death~countryName, subset(df, region =="Europe"), sum)

dplyr

library(dplyr)
df1 <- df %>% 
        filter(region == 'Europe') %>% 
        group_by(countryName) %>% 
        summarise(total_death = sum(death))

在data.table中

df1 <- setDT(df)[region == 'Europe', (total_death = sum(death)), countryName]

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61574213

复制

相似问题

闪亮，无法选择所选数据集的变量

119

跨数据集使用变量

声明变量集=选择

使用typedcolumn选择Spark数据集

基于变量的数据集的选择与聚焦

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问数据集使用和变量选择
EN

回答 2

Stack Overflow用户

Stack Overflow用户

闪亮，无法选择所选数据集的变量

跨数据集使用变量

声明变量集=选择

使用typedcolumn选择Spark数据集

基于变量的数据集的选择与聚焦

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据集使用和变量选择EN

回答 2

Stack Overflow用户

Stack Overflow用户

闪亮，无法选择所选数据集的变量

跨数据集使用变量

声明变量集=选择

使用typedcolumn选择Spark数据集

基于变量的数据集的选择与聚焦

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据集使用和变量选择
EN