首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >我该如何解释健康和体重之间的关系?

我该如何解释健康和体重之间的关系?
EN

Data Science用户
提问于 2016-08-19 22:28:33
回答 3查看 119关注 0票数 2

我的数据集中有两列:HealthWeight,它们都是数字类型的:

代码语言:javascript
运行
复制
    Health<-number of days when health is not good,
    Weight<-weight 

我只想检查一下健康和体重之间是否有关系。换句话说,Weight的增加会增加Health不好的天数还是相反的天数?我只想通过绘制一些图表来检查dataset中这两列之间的关系。

这里是我的样本数据集:

代码语言:javascript
运行
复制
| Health     | Weight      | 
|:-----------|------------:|
| 0          |      30     |        
| 3          |      63     |        
| 2          |      31     |          
| 10         |      169    |            
| 1          |      9      |    
|0           |     139     |   
EN

回答 3

Data Science用户

发布于 2017-10-25 17:50:32

建议

你可以用“健康”向量来做一个分类变量(例如,2-bin将是“高”和“低”的中间分裂,3-bin将是“高”、“中”和“低”等等的梯田),然后对每个垃圾箱做“重量”的方格图。你可能会发现,“低”和“高”是不同的。您选择的回收箱数量取决于“Health”变量的分布,您可以使用它。

Implementation

代码语言:javascript
运行
复制
library(dplyr) # for modifying datasets 
library(ggplot2) # for plotting 
library(magrittr) # for piping
stackodato <- data.frame("Health" = sample(0:10, 10), "Weight" = sample(0:200, 10)) # creating a pseudo dataset

stackodato %>% 
mutate(binnedHealth = factor(dplyr::ntile(Health, 2), labels=c("low", "high"))) %>% # add "binnedHealth" column which has the "Health" variable categorized into two factors : "high" and "low"
ggplot()+geom_boxplot(aes(x=binnedHealth, y=Weight)) # boxplot showing the distribution of "Weight" split by the "binnedHealth" factor

您也可以尝试这样做:

代码语言:javascript
运行
复制
stackodato %>% mutate(binnedHealth = factor(dplyr::ntile(Health, 2), labels=c("low", "high"))) %>% ggplot()+geom_boxplot(aes(x=Health, y=Weight, group = binnedHealth))
票数 3
EN

Data Science用户

发布于 2016-08-20 10:28:16

我支持阿伦·阿尼扬的回答。通过计算Pearson的相关系数,看看这两个特征是如何相互关联的。另一种选择是通过绘制散点图来可视化数据。

票数 2
EN

Data Science用户

发布于 2016-08-20 09:26:49

您可以对数据执行无监督的聚类(k-均值),这将给您的关系,如体重的人,其健康状况不好的特定天数。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/13564

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档