腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
具有
多个
like
列
的
Pandas
one-hot
编码
、
我在一个数据集中有几个“条件”
列
。这些
列
都有资格接收相同
的
编码
输入。这只是为了允许
多个
条件与一条记录相关联-代码结束在哪一
列
没有任何意义。因此,当我对这些变量一起应用
one-hot
编码
时,我会得到9个新
列
,但我只需要5个(一
列
集合中
的
每个唯一值对应一个
列
)。| 0 | 0 | 1 | 0 | 0 | 0
浏览 13
提问于2019-06-13
得票数 2
回答已采纳
1
回答
Dask one-hot-
编码
,不知道类别
、
、
我有
pandas
代码,其中我对
one-hot
编码
执行以下操作。df_tmp = pd.DataFrame(mlb.fit_transform(df['CatData']), columns=mlb.classes_, index=df.index) 其中,我
的
CatData
列
包含类别列表。为了处理更大
的
数据集,我尝试使用dask。大多数
pandas
功能都有一个简单
的
替代方法。然而,
one-hot
编码</em
浏览 8
提问于2019-09-20
得票数 1
2
回答
如何将返回
的
单热
编码
列
合并到原始数据帧中?
、
、
、
、
我有一个包含21个不同
列
的
banking_dataframe,其中一个是目标,其中10个是数字特征,10个是分类特征。我已经使用
pandas
的
get_dummies方法将分类数据转换为
one-hot
编码
。返回
的
dataframe有74
列
。现在,我想将
编码
的
数据帧与原始数据帧合并,这样我
的
最终数据就应该有一个分类
列
的
热
编码
值,但数据帧
的</
浏览 2
提问于2019-08-01
得票数 0
1
回答
如何转换
pandas
数据框中
具有
超过185个唯一值
的
字符串数据类型
列
、
、
、
我有一个由17个以上
的
列
组成
的
pandas
数据框架,其中一个名为Countries
的
特定
列
在该
列
中包含180
多个
唯一值。如何在超过180
列
的
列
中执行
one-hot
编码
?提供整个数据帧
的
示例0 Sub-Saharan Africa
浏览 21
提问于2021-05-25
得票数 0
1
回答
我们能标准化一个实际上是分类
的
数字
列
吗?
、
、
我有房价-高级回归技术
的
数据集。我需要在上面做Lasso和Ridge正则化。我将训练数据保存在名为house
的
变量中。键入以下代码:得到以下输出: 此数据集中有一些
列
是数值
的
(int64和float 64),但它们实际上是分类
的
(包括序数和标称)。我想问我是否可以标准化这些分类变量,或者我是否应该首先使用house[col_name]=house[col_name].astype(str)将所有这些变量转换为"object“类型,然后对这些变量进行一次性
编码<
浏览 27
提问于2021-05-18
得票数 0
2
回答
pd.get_dummies是独一无二
的
编码
吗?
、
、
one-hot
编码
和虚拟
编码
的
区别,当使用默认参数(即drop_first=False)时,
pandas
.get_dummies方法是
one-hot
编码
吗?下面是一个示例:import
pandas
浏览 2
提问于2018-01-09
得票数 15
回答已采纳
1
回答
python对线性回归中参数名称
的
控制
、
、
有没有一种聪明
的
方法可以将分类特征转换为一次性
编码
,然后运行线性回归模型,并获得估计
的
参数以及它们所引用
的
变量
的
名称(在python中)?
浏览 1
提问于2019-10-01
得票数 1
3
回答
XGBoost/CatBoost中包含大量类别的分类变量
、
、
、
、
我有一个关于随机森林
的
问题。假设我有关于与项目交互
的
用户
的
数据。项目的数量很多,大约有10000个。我
的
随机森林
的
输出应该是用户可能与之交互
的
项目(比如推荐系统)。对于任何用户,我都希望使用一个功能来描述用户过去与之交互过
的
项目。然而,将分类产品特征映射为一次性
编码
似乎非常低效,因为用户最多与几百个项目交互,有时甚至只有5个项目。当输入特征之一是
具有
大约10,000个可能值
的
分类变量,而输出是
具有
大
浏览 0
提问于2017-09-27
得票数 3
2
回答
如何迭代csv文件
的
列
以将其拆分为
多个
文件?
我对Python完全陌生(我是上周开始
的
!),所以当我看着类似的问题时,我很难理解发生了什么,甚至更难让它们适应我
的
情况。 我有一个csv文件,其中行是日期,
列
是不同
的
区域(参见图1)。我想创建一个包含3
列
的
文件:日期、区域和指示器,其中对于每个日期和区域名称,第三
列
将
具有
正确
的
指示器(参见图2)。我尝试将宽数据转换为长数据,但我不能很好地使其工作,正如我所说
的
,我对Python完全陌生。我
的
第二种
浏览 9
提问于2021-04-07
得票数 0
回答已采纳
1
回答
Pandas
DataFrame:如何将数字
列
转换为成对分类数据?
、
、
、
、
给定一个
pandas
dataFrame,如何将
多个
数值
列
(其中x≠1表示值存在,
pandas
值不存在)转换为成对分类数据框?我知道这类似于
one-hot
解码,但
列
并不完全是one - hot。
浏览 21
提问于2019-03-20
得票数 2
回答已采纳
2
回答
“一热”
编码
因变量在随机森林中
的
应用
、
、
、
、
我使用sklearn-learn在python中构建了一个随机森林,并对所有分类变量应用了“一热”
编码
。问:如果我将"one hot“应用到我
的
DV,我是将它
的
所有虚拟
列
都作为DV应用,还是应该以不同
的
方式处理DV?
浏览 4
提问于2018-12-03
得票数 3
1
回答
在
one-hot
编码
期间/之后,是否可以使用另一
列
的
值来代替binary标志?
、
、
我想知道是否有任何方法可以在
one-hot
编码
后将我
的
分类
列
转换为来自另一
列
的
值,而不是其中一个类别中
的
二进制"1“?我
的
数据帧如下所示:1 TEXAS 12342 1在标签和
one-hot
12342 1 2 0 1
浏览 20
提问于2019-07-24
得票数 0
回答已采纳
1
回答
是否有一种方法可以将按月
的
日期
列
拟合到
具有
分类数据
的
多元线性回归模型中?
、
、
、
我尝试了使用分类变量
的
多元线性回归。使用了一种热门
的
编码
器技术来解决这个问题,但得到了这个错误。我曾尝试使用pd.to_datetime()函数将日期字符串转换为时间戳,但也出现了类似于-- TypeError: int()参数必须是字符串、类似字节
的
对象或数字,而不是' timestamp‘
的
错误因此,我删除了这个东西,并使用其他方法解决了实际指定
的
错误。OneHotEncoder ohe = OneHotEncoder(categorical_features = [0]
浏览 15
提问于2019-08-31
得票数 0
1
回答
使用包含
具有
特定值
的
其他
列
的
名称
的
字符串将
列
添加到dataframe
、
这类似于reversing
one-hot
encoding,但是我有
多个
列
可以被标记。我有这个: |col1|col2||0 |1 ||1 |0 |'col1' ||1 |1 |'col1_col2'| 这是我尝试过
的
: df.idxmax(axis=
浏览 9
提问于2019-06-18
得票数 0
回答已采纳
2
回答
如何使用DictVectorizer转换分类
列
、
、
、
我有一些数据帧,它
的
一些
列
(C1、C2、C3)是分类(字符串)变量。DictVectorizer(dtype='str')但在那之后,我得到
的
错误如下
浏览 0
提问于2018-06-10
得票数 0
1
回答
sklearn中
的
fit_transform,transform和熊猫中
的
get_dummies有什么不同?
、
、
当我在sklearn和
pandas
中使用
one-hot
编码
进行数据处理时,我有两个选择:它们之间有什么不同?它们有同样
的
效果吗? 谢谢
浏览 0
提问于2016-11-27
得票数 1
21
回答
如何在Python中进行热
编码
?
、
、
、
我有一个包含80%分类变量
的
机器学习分类问题。如果我想使用某个分类器进行分类,我必须使用一个热
编码
吗?我可以在没有
编码
的
情况下将数据传递给分类器吗?/dataset/train.csv",将分类特征
的
类型更改为'category': non_categorial_features =‘orig_distance_distance’,'srch_rm_cnt'cnt’:如果categorical_feature不在non_categori
浏览 172
提问于2016-05-18
得票数 194
1
回答
2类MLP分类器被强制为1个输出(二进制分类器)
、
我在python中对不同类型
的
数据集使用MLP分类器。提前感谢!
浏览 19
提问于2017-06-17
得票数 0
1
回答
为什么这个函数不能应用于熊猫DataFrame?
、
、
、
、
我正在与一个非常大
的
熊猫DataFrame
的
工作,并想要一个热
编码
的
“属性”在
列
中
的
每一行对应于每个属性。这些属性
列
在“attributes”
列
中,我希望遍历该
列
,然后针对各个
列
。,它花费了永远
的
时间。我将在下面列出我一直在尝试
的
选项,如果这里有什么问题,请告诉我,或者如果Jupyter Notebook不是处理大量数据
的
合适地方,我也会非常感谢你
的</e
浏览 3
提问于2021-02-18
得票数 0
2
回答
如何将一次热
编码
的
结果拼接成一个数据帧?
、
我想在以下位置提供的人口普查数据集中执行
one-hot
编码
: import
pandas
as pd return fValueError: Columns must be same length as keypp=preproce
浏览 0
提问于2019-08-05
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习中的独热编码
Pandas与SQL的数据操作语句对照
one-hot encoding不是万能的,这些分类变量编码方法你值得拥有
数据预处理之One-Hot
第六篇:Word2Vec的介绍
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券