腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
一
列上
安装
一个
热
编码器
,
并
适用于
多个
列
、
、
我有
一个
包含两个分类
列
的dataframe,其中包含
一
组相同的字符串,我希望对其进行单
热
编码。确定
列
可以包含的字符串集,并且两
列
之间的one-hot编码必须
一
致。这两
列
都包含所有可能的值,甚至多次包含。问题1:这有意义吗?问题2:如何为两个
列
的one-hot编码返回的<em
浏览 4
提问于2019-10-30
得票数 0
回答已采纳
2
回答
如何在
一
次
热
编码后给出列名?
、
、
为了解释,
在
我的数据集中有10
多个
分类
列
,每个分类
列
都有200-300个类别。我想把它们转换成二进制值。为此,我使用第
一个
标签
编码器
将字符串类别转换为数字。标签
编码器
代码和输出如下所示。
在
标签
编码器
之后,我使用了
一个
来自scikit的
热
编码器
-重新学习,它是工作的。但问题是,我需要列名后
一个
热
编码器
。,例如,
列
浏览 4
提问于2017-07-13
得票数 6
5
回答
如何在
一
次
热
编码后给出列名?
、
、
、
为了解释,
在
我的数据集中有10
多个
分类
列
,每个分类
列
都有200-300个类别。我想把它们转换成二进制值。为此,我使用第
一个
标签
编码器
将字符串类别转换为数字。标签
编码器
代码和输出如下所示。
在
标签
编码器
之后,我使用了
一个
来自scikit的
热
编码器
-重新学习,它是工作的。但问题是,我需要
一个
热
编码器
后的列名。例如,A
浏览 2
提问于2019-05-28
得票数 29
回答已采纳
1
回答
分类特征编码
、
、
、
、
我在做
一个
分类模型。我有明确和连续的数据。分类
列
包括两个类的
列
,如性别(男性、女性)和多类
列
(如位置)。我想出的解决方案是只<e
浏览 0
提问于2022-01-20
得票数 1
1
回答
处理标签编码的未知值
、
、
、
、
标签
编码器
只有
在
检测到新标签的例外情况下才会爆炸。 我要的是通过one-hot-encoder.对分类变量进行编码。然而,sk-学习不支持字符串。所以我
在
每
一
列上
都使用了标签
编码器
。我的问题是,
在
我的管道交叉验证步骤中,未知标签会出现。基本的单
热
编码器
可以选择忽略这种情况。
浏览 2
提问于2016-10-29
得票数 17
回答已采纳
2
回答
如何将分类数据类型用于随机森林分类?
、
、
、
当我试图拟合这些数据时,我得到了
一个
错误。可能是对象数据类型的问题。如何在不应用RF转换的情况下对分类数据进行拟合?
浏览 0
提问于2018-01-04
得票数 14
回答已采纳
2
回答
当
多个
列
包含相同的值时,如何对大型数据进行
热
编码?
、
、
我有
一个
dataframe,
多个
列有像[0,1]这样的值,如果我要去对df进行
一个
热
编码,我将有
多个
名称相同的
列
。 繁琐的解决方案将是手动创建唯
一
的
列
,但我有58
列
是分类的,所以这看起来不太有效。
浏览 12
提问于2017-10-09
得票数 3
回答已采纳
3
回答
字符串分类特征的
一
种
热
编码
、
、
、
我正在尝试对
一个
普通数据集执行
一个
热
编码。
在
第
一
反应中,你会看到科学学习的。但是
一个
热
编码器
不支持字符串作为特性,它只对整数进行离散。那么,
在
Scikit-学习中,最好的方法是什么
浏览 8
提问于2016-01-30
得票数 37
1
回答
熊猫-将分类数据分解成
列
、
foo': ['b', 'a,b', 'a,c', 'a,b,c'], 我希望有
一个
包含'a‘、'b’、'c‘、'X’、'Y‘、'Z’
列
的表,其中包含False/True条目。这不是<
浏览 2
提问于2018-05-27
得票数 1
回答已采纳
1
回答
虚拟变量陷阱
、
、
、
在
我的机器学习课程中,我学习多元线性回归,我们讨论了虚拟变量陷阱。我有
一个
数据集,其中包含美国、英国、法国和德国的国家、英国、fr、ge等字母编码的每个国家的国家、身高、体重、性别,而当我将这些分类变量转换为数字变量(用
一个
热
编码器
)时,性别被of编码,我对以下内容感到困惑当我们用两个不同的
列
对M和F进行编码时,如果我们不删除其中
一
列
,我们就会陷入虚拟变量陷阱,因为男性
列上
的"1“显然意味着女性
列上
的&qu
浏览 0
提问于2020-04-19
得票数 1
回答已采纳
3
回答
如何使用scikitlearn保存
一个
热门的编码模型
并
预测新的未编码数据?
、
、
我的数据集包含3个分类特征,我使用
一个
热
编码将其更改为二进制格式,
一
切都很顺利。但是,当我想要保存训练好的模型
并
预测新的原始数据时,输入的数据没有像我预期的那样进行编码,从而导致错误。
浏览 31
提问于2019-05-22
得票数 2
1
回答
如何利用Pandas get_dummies对预测数据进行预测?
在
3个分类
列上
使用Pandas get_dummies来获得
一个
热
编码的Dataframe之后,我已经训练了
一个
Perceptron模型(
并
取得了
一
些成功)。现在我想预测
一个
新的观察结果,它不是
热
编码。 有任何方法记录get_dummies
列
映射来重用它吗?
浏览 2
提问于2018-05-31
得票数 5
回答已采纳
1
回答
带有预定义类的标签编码
、
、
我已经训练了
一个
模型(随机森林),现在我想用它来预测某
一
天的某些数据。我有
一个
分类
列
,其中有
一
些值(例如a,b,c,d,e)。 现在,
在
特定的
一
天,只有其中
一
些值存在(例如b,d)。现在,当它们变成
一个
热
编码时,我使用的是LabelEncoder和
一个
热
编码器
.但是,如果我给出标签编码的
列
,它只是标记'b‘和'd’(例如1&a
浏览 0
提问于2018-09-07
得票数 3
1
回答
基于树的算法和序数特征
、
、
、
对于基于树的方法(例如DT、随机森林、梯度增强等),序数特征到连续物质的转换间隔重要吗?(我明白为什么它对线性模型很重要,但对于基于树的方法我并不清楚) 例如:将序号特性从[‘Low’,’Medium’,’High’]转换为[1,2,3]与将其转换为[1,99, 876]有区别吗?
浏览 0
提问于2020-10-15
得票数 1
回答已采纳
1
回答
如何处理标号分类和标签编码?
、
、
、
、
guitar 1.5现在,我想处理那些名义的分类变量,简单而接近的方法是使用标签编码,但假设我使用的是sklearn标签
编码器
0 04 0 1 0 1 现在,它正在转换每
一
列
,但每
列
的数值范围从0到5不等。仪器变量现在类似于“same”变量,因为两者都有相似的数据点,这肯定不是
一</e
浏览 0
提问于2018-07-31
得票数 0
回答已采纳
2
回答
从其他熊猫栏创建新栏目
、
、
、
我想从
列
创建
一个
新的
列
。“类型”
列
包含
一个
或
多个
类型,我希望为每个类型名称创建
一个
列
。然后,我想在每个专栏中填写1和0,这取决于它们是否有这种类型。 我不需要这样的东西
浏览 6
提问于2022-05-12
得票数 0
回答已采纳
2
回答
如何将数据框
列
中的
多个
值拆分为单独的
列
、
我有
一个
包含
多个
值的
列
。我希望将唯
一
值拆分为
多个
带有标题的
列
,然后应用标签
编码器
或
一个
热
编码器
(我还不知道),因为我有
一个
多标签文本分类问题要解决。我试着但它只拆分第
一
项。此外,
在
尝试拆
浏览 0
提问于2019-06-03
得票数 0
1
回答
目标/输出标签的
一
种
热
编码与标签编码的区别
、
、
、
我遇到了
一个
问题,那里有20节课。我设计了
一个
神经网络,
并
使用损失作为categorical_crossentropy。y_train_le = le.fit_transform(y_train) y_t
浏览 4
提问于2022-08-07
得票数 -1
1
回答
使用MinMaxScaler、label
编码器
、
一个
热
编码器
、keras预测文件进行以后的预测。
、
其中包括9个文本
列
和29个数字
列
。
在
使用label
编码器
和
一个
热
编码器
进行编码之后,它有超过10,000
列
。现在,我喜欢保存那些定标器、
编码器
和预测文件,供以后使用。但我不知道以后如何保存和使用它们来进行单
一
预测。任何帮助都是感激的。谢谢
浏览 0
提问于2019-01-14
得票数 0
回答已采纳
1
回答
可以对目标要素进行标签编码,然后再应用one-hot编码
、
、
我想要应用决策树分类器,
在
我将目标特征标签编码为0,1,2,3之后,我是否可以再次对其应用one-hot编码?这是允许的吗?
浏览 2
提问于2020-05-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python使用pandas使数据可视化笔记
数据库性能优化之SQL语句优化(下)
请补全下列语句建立一个性能最优的索引
SQL 中的 用法
喷码机是如何联动切片机喷码的|模切机喷码机
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券