腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
我
应该
如
何在
分类
变量
和
连续变量
之间
进行
一致性
分析
?
measurement
、
reliability
我
目前很难选择一种统计测试来验证使用两种不同测量风格的两种测量
之间
的
一致性
。下面是
我
的
变量
的结构。
我
将使用
我
的数据的一个假示例来帮助演示
我
的问题。测量一:8个类别的1个标称
变量
-主要汽车选择,例如,您的主要汽车选择是什么。例如,1=福特,2=霍尔登,3=丰田,4=三菱,5=马自达,6=现代,7=斯巴鲁,8=大众。测量二:从测量一中提取8个类别的8个
连续变量
。例如,请评估您购买a____福特的可能性。参与者在所有8个<
浏览 62
提问于2021-04-14
得票数 1
1
回答
如
何在
Python中实现自动方差
分析
machine-learning
、
python
、
feature-engineering
、
dimensionality-reduction
、
kaggle
我
正处于模型降维阶段。
我
有一个
分类
列的列表,
我
希望找到每一列与我的连续SalePrice列
之间
的相关性。'MiscFeature', 'SaleType', 'SaleCondition', 'Street', 'CentralAir'] 因为它是绝对的还是连续的,
我
读到了
我
想循环并输出列表中的每个元素与SalePrice列
之间
的相关性。
浏览 0
提问于2019-07-14
得票数 3
回答已采纳
2
回答
R中使用混合模型的潜在类
分析
r
、
statistics
、
cluster-analysis
、
mixture-model
我
试图在R中执行潜在的类
分析
,但我有一些
变量
既是连续的,也是
分类
的。此外,
我
有52个状态或行,
我
正在尝试有52个潜在的类或子组。
我
开始用R编写代码,但是
我
得到了一个错误。value = contr.funs[1 + isOF[nn]]) : contrasts can be applied only to factors with 2 or more levels 这是
我
的
浏览 9
提问于2018-12-14
得票数 1
1
回答
连续输入与范畴输出的关联
statistics
、
logistic-regression
、
correlation
我
有两个独立的
连续变量
,
如
年龄、价格
和
结果
变量
,
如
购买与否。 现在,
我
应该
用哪个测试来确定连续输入
变量
与
分类
结果
变量
之间
的关联?
浏览 0
提问于2021-05-25
得票数 0
4
回答
我
应该
使用决策树或逻辑回归来
进行
分类
吗?
classification
、
logistic-regression
、
decision-trees
我
正在研究一个
分类
问题。
我
有一个包含相同数量的
分类
变量
和
连续变量
的数据集。如
何在
决策树
和
逻辑回归
之间
决定使用哪种技术?假设logistic回归更适合
连续变量
,决策树更适合
连续变量
和
范畴
变量
,这是否正确?
浏览 0
提问于2015-06-09
得票数 17
回答已采纳
1
回答
由
分类
数据
和
连续数据组成的数据集的聚类
分析
?
r
、
cluster-analysis
我
一生中从来没有做过聚类
分析
,
我
整齐地遵循了一本关于如
何在
R中
进行
聚类
分析
的书中的步骤。R:无监督机器学习的聚类
分析
实用指南:第1卷(多元
分析
),Alboukadel Kassambara先生 然而,
我
遇到了一个问题,因为在这本书中,数据标准化取代了数值
变量
,然而,
我
有一个由13个
变量
组成的数据集,其中最主要的是
分类
。
我
查过google
和
浏览 2
提问于2018-07-18
得票数 0
回答已采纳
1
回答
用于PCA的单尺度热编码
变量
scikit-learn
、
pca
、
one-hot-encoding
我
有混合了
连续变量
和
分类
变量
的数据。
我
计划对
分类
变量
进行
一次性编码,缩放数据集(mean=0,std=1),然后执行主成分
分析
以减少维数。
我
需要知道在做PCA之前,
我
是否也
应该
对单热点编码
变量
进行
类似的缩放?为此,
我
将使用python scikit-learn包。
浏览 0
提问于2018-05-22
得票数 2
2
回答
发现相互作用
r
、
predictive-modeling
你如何发现
连续变量
和
范畴
变量
之间
的交互作用?
我
尝试过使用ggPredict,但如果有更多的级别,它似乎无法工作。
我
有一个作为声誉的
分类
变量
,它有7个等级,
我
还有多个
变量
来预测一个学生在下一次硕士考试中的分数,
如
年龄、pref_hand、身高、考试1、考试2、考试3。如何找到声誉与我发现的最佳模型
之间
的相互作用,用前向逐步回归来预测下一次考试中的分数,如果
我
发现交互
浏览 0
提问于2018-11-13
得票数 0
1
回答
范畴
变量
与回归的关联
regression
、
data
、
categorical-data
、
pearsons-correlation-coefficient
我们
进行
数据
分析
和
建立模型。例如,
我
构建了一个具有多个预测器(多元回归)的回归模型。然后我们检查了许多事情:正态性、多重共线性等,特别是我们检查了多重共线性、数值/
连续变量
、变差通货膨胀因子( VIF )等,如果我们发现存在多重共线性,那么我们就去掉了其中一个高度相关的特征。
我
的问题是:
分类
变量
可以做些什么?
我
的意思是,如果两个
分类
变量
是相关的/相关的,这是否意味着
我</
浏览 0
提问于2016-05-08
得票数 1
2
回答
我
如何找到最佳的生存
分析
分类
?
survival-analysis
、
lifelines
我
有个关于生存
分析
的问题。然而,
我
有以下数据(只是一段摘录):现在,
我
尝试使用Python生命线包
进行
生存
分析
。例如,
我
想知道T细胞是否影响整体生存(OS).但据我所知,
我
需要把T细胞的数目分为不同的类别,例如高T细胞
和
低T细胞.是那么回事吗?但我该怎么找出最合适的人选呢?
我
的计划是证明高T细胞的肿瘤比低T细胞有更好的存活。但是,
我
如何才能找到最好的截断值来区分高T细胞
和</em
浏览 19
提问于2021-03-26
得票数 1
回答已采纳
1
回答
用
分类
变量
水平估计h2o广义线性模型系数
r
、
glm
、
h2o
我
想通过h2o glm中的
分类
变量
水平来估计预测器的系数。例如,如果
我
的数据框有产品价格(
连续变量
)
和
产品类型(
分类
变量
),那么
我
想按产品估计价格系数。如
何在
h2o或R中执行相同的操作?非常感谢,
浏览 0
提问于2016-12-08
得票数 0
2
回答
如
何在
字符串仅为R的数据上运行群集
r
、
string
、
cluster-analysis
、
unsupervised-learning
我
试图在一个非常大的数据集中运行一个集群。它只包含用于值的字符串。
我
已经删除了NA,并与一个虚拟值重新关联。
我
的K-指R的意思是由于那强迫症而不断失败。社区将如
何在
这些数据上运行集群。
我
正在尝试查看这些列中是否有任何列导致数据较早中断,而另一列则试图理解可能的结构。用K均值
进行
思想聚类是最好的方法,但不知道如何处理字符串。已经转化为R中的因素,但仍然存在问题。
浏览 0
提问于2018-06-20
得票数 0
1
回答
二值连续输入R中的决策树
r
、
machine-learning
、
decision-tree
、
rpart
我们正在用连续输入
和
二进制输入建立决策树的模型。我们正在
分析
天气对自行车行为的影响。线性回归表明“雨”对自行车数量有很大的影响。我们的雨
变量
是二进制,表示每小时下雨的状态。这可能是由于雨
变量
的
分类
所致。Rpart似乎更喜欢使用
连续变量
(
如
温度)作为决策节点。 对于rpart如何决定是否使用
连续变量
或二进制
变量
作为决策节点,我们
应该
知道什么?有可能控制这种
变量
的选择吗?
浏览 3
提问于2015-12-04
得票数 0
4
回答
决策树的缺点
decision-trees
我
在博客中看到决策树有以下缺点:如果这是真的那为什么?
浏览 0
提问于2018-05-10
得票数 1
2
回答
使用卡方检验
进行
特征选择
machine-learning
、
feature-selection
、
chi-squared
我
总是很难理解卡方检验的意义,以及如何使用它
进行
特征选择。
我
试着阅读维基页面,但我没有得到一个实际的理解。有谁能解释一下吗?
浏览 3
提问于2014-02-05
得票数 1
1
回答
范畴(序数)与离散(连续)值的相关性
correlation
我
正在做双
变量
分析
,但现在
我
希望看到我的分布
之间
的相关性。
我
怎样才能看出两者
之间
的相互关系?
我
必须为
我
的钱的数额创建课程吗?
浏览 0
提问于2019-09-25
得票数 1
2
回答
如何检查
连续变量
和
分类
变量
之间
的相关性?
python
、
linear-regression
、
correlation
、
categorical-data
我
有一个数据集,包括
分类
变量
(二进制)
和
连续变量
。
我
正在尝试应用线性回归模型来预测
连续变量
。有人能告诉
我
如何检查
分类
变量
和
连续目标
变量
之间
的相关性吗?psychother', \ 'fibrosisandother', 'malnutrition', 'hemo']]
浏览 0
提问于2017-06-22
得票数 14
回答已采纳
1
回答
在使用类似
分类
器的决策树之前,我们
应该
把独立的
连续变量
(特征)转换成
分类
变量
吗?
machine-learning
、
classification
、
random-forest
、
decision-trees
、
preprocessing
假设
我
有一个因
变量
来预测“态度”,它可以有三个值“正/负/中性”。
我
有以下自
变量
或特征-年龄,身高,性别,收入等。
我
试图预测态度的决策树
分类
器。态度~年龄+身高+性别+收入(决策树)这是过度适应的问题吗?是否
应该
将
连续变量
转换为范畴<em
浏览 0
提问于2016-07-10
得票数 1
回答已采纳
1
回答
如
何在
具有
分类
变量
和
连续变量
的数据集中查找
和
计算相关性?
python
、
correlation
我
正在研究一个保险域用例,以预测现有客户是否会购买第二份保险单。
我
在不同的类别下有一些客户的个人详细信息,
如
婚姻状况,吸烟者(是或否),年龄(年轻,成人,老年人),性别(男性/女性),以及少数
连续变量
,
如
保费支付,保险金额。
我
的目标是使用
分类
变量
和
连续变量
的混合集合来预测类别(1-将购买第二份保单,0-不会购买第二份保单)。那么,
我
如
何在
这个数据集中找到/计算相
浏览 2
提问于2019-11-16
得票数 0
1
回答
当我们既有
连续变量
又有类别
变量
作为预测
变量
时,如
何在
多项逻辑回归中检验多重共线性?
r
、
logistic-regression
如
何在
多项逻辑回归中检验多重共线性?
我
有25个自
变量
和
1个因
变量
。在25个独立
变量
中,17个
变量
是
连续变量
,8个
变量
是
分类
变量
(具有两个值:是/否或足够/不足)。
我
想检查这些自
变量
之间
的多重共线性。
我
正在使用R,提前谢谢!
浏览 76
提问于2019-02-27
得票数 0
点击加载更多
相关
资讯
R语言逻辑回归分析连续变量和分类变量之间的“相关性“
样本含量估计的主要研究设计类型
用机器学习分析流行音乐(二):探索性数据分析
教你如何方便正确地使用Python和Pandas来匿名信息
【机器学习理论基础】定量变量和定性变量
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券