腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
大量
分类
变量
上
使用
get_dummies
()
和
OneHotEncoding
、
在
大多数学术示例中,我们
使用
get_dummies
()或
OneHotEncoding
()来转换
分类
特征。假设我想
使用
国家作为一个特征,在数据集中我们有100个不同的国家。当我们
在
国家/地区应用
get_dummies
()或
OneHotEncoding
()时,我们将获得100列,模型将
使用
100个国家/地区列+其他功能进行训练。当我们
使用
get_dummies
()或
浏览 31
提问于2019-03-13
得票数 1
1
回答
获取由
get_dummies
创建的伪
变量
的名称
、
、
我有一个数据帧,其中包含
大量
不同类型的列。我想
使用
get_dummies
()对数据帧中的
分类
变量
进行编码。问题是:有没有一种方法可以获得
get_dummies
()创建的编码
分类
列的列标题 最困难的方法是提取数据帧中所有
分类
变量
的列表,然后将与每个
分类
变量
相关联的不同文本标签附加到相应的列标题。
浏览 16
提问于2020-09-10
得票数 0
1
回答
如何编码具有
大量
值的CATEGORICAL_COLUMNS?
、
、
、
我正在
使用
Tensorflow、python、Pandas创建一个类似于此的logistic回归模型。 我
使用
的不是MNist数据集,而是我自己的数据集。我
使用
Pandas创建数据格式,将nulls替换为填充it函数,然后
使用
from_tensor_slices将其转换为张量数据集。我有很多CATEGORICAL_COLUMNS,我正在
使用
get_dummies
来做
OneHotEncoding
(
和
LabelEncoding一起)。但问题是,我的<em
浏览 2
提问于2020-03-30
得票数 0
回答已采纳
5
回答
与
oneHotEncoding
的问题
、
、
因此,我
在
一个列中有一个带有
分类
变量
的PandasDataFrame,我想对它进行一个热编码,我
使用
了来自ML课程的以下代码但是,我得到以下错误
使用
以下方法将一些信息
变量
资源管理器中的Y类型是object,如果执行 t
浏览 0
提问于2017-10-18
得票数 8
1
回答
在
Pandas中执行
get_dummies
时保留其他
变量
、
、
我有一个ID
变量
和
另一个
分类
变量
的DataFrame。我想用
get_dummies
从
分类
变量
中创建虚拟
变量
。但是,这会使ID
变量
消失。稍后我需要这个ID
变量
来合并到其他数据集。 有没有办法让其他
变量
。
在
get_dummies
的文档中,我什么也找不到。谢谢!
浏览 1
提问于2016-07-23
得票数 5
回答已采纳
1
回答
输入形状差(5634,2)
、
、
我尝试了所有的方法,但我不知道如何解决以下错误:这是我的第一个机器学习的例子,所以请容忍我。这是python代码:import pandas as pdimport seaborn as snswarnings.filterwarnings("ignore")from IPython import get_ipython ipy
浏览 0
提问于2019-11-28
得票数 0
1
回答
sklearn.linear_model.Lasso能否识别pandas数据帧中的
分类
数据类型?
、
、
我想在sklearn中
使用
套索回归来运行我的数据。我的dataframe中的所有属性都是数字类型(数字,我的意思是它们都是整数)。但它们中的一些显然应该是
分类
的(例如,我的dataframe中的“race”属性是一个具有三个值1,2,3的属性,其中每个值代表一个种族)。我所做的是首先
使用
astype('str')将这些列设置为字符串类型,然后
使用
代码astype('categorical')将这些列的数据类型转换为
分类
类型。最后,我对这些转换后的特性
使用</
浏览 12
提问于2020-05-20
得票数 1
回答已采纳
1
回答
如何
使用
.cat.codes
和
get_dummies
、
我知道
get_dummies
会根据
变量
的数量返回多个列,而.cat.code则返回一个列,每个值都有唯一的整数(如果我错了,请纠正我)。我知道fro .cat.codes用于
分类
数据,
get_dummies
用于对象。 我可以在对象
上
使用
astype("Category"),在对象
上
使用
.cat.codes吗?当涉及到这些功能时,还有什么可以使分析(
和
可视化)更容易呢?
浏览 0
提问于2020-08-01
得票数 0
4
回答
可能的方法来做一个热编码
在
科学工具-学习?
、
、
我有一个熊猫数据框架
和
一些
分类
栏。其中一些包含非整数值。 目前,我想对这些数据应用几种机器学习模型。为了取得更好的效果,对某些模型进行规范化是必要的。例如,将
分类
变量
转换为虚拟/指示
变量
。事实
上
,熊猫有一个名为
get_dummies
的功能。但是,此函数将根据数据返回结果。因此,如果我
在
训练数据上调用
get_dummies
,然后
在
测试数据
上
再次调用它,那么
在
两种情况下实现的
浏览 9
提问于2015-12-09
得票数 6
回答已采纳
1
回答
标签编码器
和
OneHotEncoder
在
相同的for循环中
、
、
、
我有
大量
的
分类
值,最初,for循环为标签编码器工作,但我尝试
在
单独的行
上
使用
get_dummies
,而是包含一个onehotencoder。encoded and {} columns were 1-hot encoded'.format(le_count, enc_count)) 但是当我运行它时,我不会看到错误,但是编码是非常奇怪的,
大量
的元组被插入到我的新数据集中当我运行代码时,不要
使用
use子句中的所有内容,它就可以很好地运行,我只需
浏览 1
提问于2022-04-28
得票数 0
回答已采纳
1
回答
需要帮助创建
使用
另一列中的值而不是'1‘的伪伪
变量
、
、
、
我有一个数据帧,看起来像这样:本质
上
,cols
和
C需要成为伪
变量
,头文件为B_x、B_y、C_a、C_b。该函数与
get_dummies
()
在
pandas中的工作方式几乎完全相同,只有一个主要区别:对于创建的所有伪
变量
,我需要A列中的值,其中值应为1。<code>A1</code> 我正在处理具有
大量
类别的相当大的数据。我尝试过在数据集
上
使用<
浏览 11
提问于2019-03-27
得票数 0
回答已采纳
1
回答
为什么SciKit-学习的OneHotEncoder
在
大型数据集
上
花费这么长时间?
、
、
我正在
使用
一个较早版本的SciKit,1.0.2版本,尝试并OneHotEncode一些数据。我的数据集相当大,184个列将在
OneHotEncoding
之后转到311列,有大约50万行。目前,SciKit-学习的OneHotEncoder是10分钟
和
计数。为什么这段代码这么慢?我能做些什么来加速这一切吗?
浏览 0
提问于2022-11-29
得票数 1
回答已采纳
10
回答
当并非所有类别都存在时,虚拟
变量
、
、
、
我有一组数据格式,其中一个列包含一个
分类
变量
。我想把它转换成几个虚拟
变量
,在这种情况下,我通常
使用
get_dummies
。所发生的事情是,
get_dummies
查看每个数据中可用的数据,以找出有多少类别,从而创建适当数量的虚拟
变量
。然而,
在
我现在正在研究的问题中,我实际
上
提前知道了可能的类别是什么。我的问题是:是否有一种方法将类别的名称传递给
get_dummies
(或等效的函数),这样,对于没有出现在给定数据nam
浏览 30
提问于2016-05-25
得票数 60
回答已采纳
2
回答
降维
在
OneHotEncoded阵列中的应用
、
、
我有一个包含混合
变量
的非常大的数据集。我已经
使用
OneHotEncoding
将
分类
变量
转换为数值
变量
,它产生了超过几千个不同的特性,即组合。是否有可能在OneHotEncoded数据
上
应用降维算法,这看起来像[[1. 0. 1. 0.]...[0. 0. 0. 0.]],还是应该通过与原始数据集合并来实现?
浏览 0
提问于2018-02-19
得票数 8
回答已采纳
1
回答
TypeError:'OneHotEncoder‘对象不可迭代
、
我试图
在
以下数据集的
分类
变量
上
使用
OneHotEncoding
。 首先,我正在尝试转换“地理”专栏。
浏览 2
提问于2021-11-17
得票数 1
回答已采纳
1
回答
想知道pd.factorize,pd.get_dummies,sklearn.preprocessing.LableEncoder
和
OneHotEncoder之间的区别
、
、
、
、
在
某些情况下,有些可能会产生同样的结果,而有些则不会。任何帮助都会感谢你的!
get_dummies
和
OneHotEncoder将产生相同的结果,但OneHotEncoder只能处理数字,但
get_dummies
将接受各种输入。
get_dummies
将为每个列输入自动生成新列名,但OneH
浏览 4
提问于2016-10-31
得票数 24
回答已采纳
1
回答
mlContext.Transforms.Categorical.
OneHotEncoding
方法
和
mlContext.Transforms.Text.FeaturizeText方法有什么不同?
、
我遇到了一个
分类
问题,其中
使用
FeaturizeText方法将一些文本值转换为数值vector.For,
在
回归问题中
使用
OneHotEncoding
方法也是如此。那么有什么不同呢?提前谢谢。我
在
微软的文档中找不到任何有用的东西。
浏览 23
提问于2019-04-25
得票数 2
2
回答
熊猫
get_dummies
in for循环
、
我希望
在
循环中
使用
for将
分类
变量
转换为虚拟
变量
。但是,下面的代码并不转换数据格式。pd.get_dummies(df, columns = categorical_fields) 我知道for循环中的迭代器只是一个临时
变量
是否必须为每个数据文件手动运行
get_dummies
?Pandas
get_dummies
不提供inplace选项。
浏览 3
提问于2018-05-15
得票数 0
回答已采纳
1
回答
测试集
上
存在不可见数据的
OneHotEncoding
问题
、
、
、
我有包含数值
变量
和
分类
变量
的数据。我把数据分成了训练
和
测试。我想在填充之后做一次热编码。测试集上有不可见的数据。 我知道handle_unknown='ignore'解决了这个问题。
OnehotEncoding
不能同时采用这两种方法。 有没有办法既能处理看不见的数据,又能避免多重共线性? 注意:我
使用
的是ColumnTransformer。
浏览 27
提问于2021-05-04
得票数 0
2
回答
混合数据集中的特征选择
、
我是否应该
使用
LabelEncoder并将数据从字符串转换为数字,然后继续进行关联?我走的路是对的吗?有没有更好的方法来解决这场危机?
浏览 21
提问于2021-05-20
得票数 0
回答已采纳
点击加载更多
相关
资讯
Rust 基础系列#2:在Rust 程序中使用变量和常量|Linux 中国
在iPhone和Mac上使用iCloud云端信息
如何允许特殊字符#和%在Onedrive上使用
在 Ubuntu 上安装和使用 Qemu|Linux 中国
微软继续尝试在Windows上强制使用Edge,现在使用Outlook和Teams
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券