首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据分析小技巧1:使用map对列做特征工程

数据分析小技巧1:使用map对列做特征工程

作者头像
double
发布于 2022-01-26 05:47:59
发布于 2022-01-26 05:47:59
48000
代码可运行
举报
文章被收录于专栏:算法channel算法channel
运行总次数:0
代码可运行

你好,我是 zhenguo 接下来逐步分析常用的数据分析小技巧

小技巧1:如何使用map对某些列做特征工程?

先生成数据:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
d = {
"gender":["male", "female", "male","female"],
"color":["red", "green", "blue","green"],
"age":[25, 30, 15, 32]
}

df = pd.DataFrame(d)
df

gender 列上,使用 map 方法,快速完成如下映射:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
d = {"male": 0, "female": 1}
df["gender2"] = df["gender"].map(d)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员郭震zhenguo 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Pandas 数据分析 5 个实用小技巧
我攥了很久才汇总出这个小技巧系列手册,现暂命名为:《Pandas数据分析小技巧系列手册1.0》
double
2020/12/02
2K0
Pandas 数据分析 5 个实用小技巧
风控领域特征工程
在金融行业,风险控制(风控)是核心环节,它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来,金融机构面临着前所未有的数据量和复杂性。在这样的背景下,风控领域特征工程应运而生,成为连接原始数据与精准风险评估的桥梁。
用户3578099
2024/08/20
8340
风控领域特征工程
数据分析小技巧第七集:快速清洗、定位最关键特征
我正在按照下面施工计划往前推进,标记小红旗部分已经讲完,你可以从这里:施工专题已完成 60 篇 汇总 找到过往推送文章
double
2021/01/06
3830
数据分析小技巧第七集:快速清洗、定位最关键特征
Python数据分析 | Pandas数据变换高级函数
教程地址:http://www.showmeai.tech/tutorials/33
ShowMeAI
2022/02/25
1.6K0
Python数据分析 | Pandas数据变换高级函数
Pandas数据分析小技巧系列 第二集
已推Pandas数据分析小技巧系列第一集,今天第二集,往下阅读前可以先星标:Python与算法社区,只有这样才会第一时间收到我的推送。
double
2020/12/02
9790
Pandas数据分析小技巧系列 第二集
Python数据分析之Pandas(三)
: | -----: | ------: | -----: | --------: | | 0 | 1 | 1193 | 5 | 978300760 | | 1 | 1 | 661 | 3 | 978302109 | | 2 | 1 | 914 | 3 | 978301968 | | 3 | 1 | 3408 | 4 | 978300275 | | 4 | 1 | 2355 | 5 | 978824291 |
yuanshuai
2022/08/22
1.5K0
Python数据分析之Pandas(三)
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(二)
https://github.com/YC-Coder-Chen/feature-engineering-handbook
红色石头
2022/01/14
1.1K0
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(二)
python数据分析——数据分类汇总与统计
推荐一个网站给想要了解或者学习人工智能知识的读者,这个网站里内容讲解通俗易懂且风趣幽默,对我帮助很大。我想与大家分享这个宝藏网站,请点击下方链接查看。 https://www.captainbed.cn/f1
鲜于言悠
2025/03/08
2.1K1
python数据分析——数据分类汇总与统计
提高效率,拒绝重复!7个Pandas数据分析高级技巧
与Excel相比,在Jupyter Notebook中逐行或逐组地查看数据集通常比较困难。一个有用的技巧是使用生成器并使用Ctrl + Enter而不是Shift + Enter来迭代地查看同一个单元格中的不同样本。
量化投资与机器学习微信公众号
2020/04/16
1.7K0
机器学习实战 | 机器学习特征工程最全解读
教程地址:http://www.showmeai.tech/tutorials/41
ShowMeAI
2022/03/22
2.1K0
机器学习实战 | 机器学习特征工程最全解读
Python数据分析实战(2)使用Pandas进行数据分析
Pandas的使用很灵活,最重要的两个数据类型是DataFrame和Series。
cutercorley
2020/08/26
4.3K0
特征工程-使用随机森林填补缺失值
特征工程在传统的机器学习中是非常重要的一个步骤,我们对机器学习算法的优化通常是有限的。如果在完成任务时发现不管怎么优化算法得到的结果都不满意,这个时候就可以考虑回头在做一下特征工程。
ZackSock
2021/12/30
1.8K1
Python常用小技巧总结
数据分析中pandas的小技巧,快速进行数据预处理,欢迎点赞收藏,持续更新,作者:北山啦
北山啦
2022/11/27
10.2K0
Python常用小技巧总结
sklearn中多种编码方式——category_encoders(one-hot多种用法)
离散型编码的Python库,里面封装了十几种(包括文中的所有方法)对于离散型特征的编码方法,接口接近于Sklearn通用接口,非常实用 可以使用多种不同的编码技术把类别变量转换为数值型变量,并且符合sklearn模式的转换。
悟乙己
2021/12/07
3.4K0
sklearn中多种编码方式——category_encoders(one-hot多种用法)
Pandas的apply, map, transform介绍和性能测试
来源:Deephub Imba本文约8500字,建议阅读10分钟本文介绍了如何使用 scikit-learn中的网格搜索功能来调整 PyTorch 深度学习模型的超参数。 apply函数是我们经常用到的一个Pandas操作。虽然这在较小的数据集上不是问题,但在处理大量数据时,由此引起的性能问题会变得更加明显。虽然apply的灵活性使其成为一个简单的选择,但本文介绍了其他Pandas函数作为潜在的替代方案。 在这篇文章中,我们将通过一些示例讨论apply、agg、map和transform的预期用途。 我们一
数据派THU
2023/03/29
2.3K0
Pandas的apply, map, transform介绍和性能测试
经典永不过时的句子_网红的成功案例分析
本周给大家分享的数据分析案例是泰坦尼克号幸存者预测的项目,没记错的话,这应该是很多朋友写在简历上的项目经历。如果你目前正在找工作,自身缺少项目经历并且想要充实项目经历的话,可以考虑一下这个项目!
全栈程序员站长
2022/11/01
8790
图解机器学习特征工程
上图为大家熟悉的机器学习建模流程图(扩展阅读:一文全览机器学习建模流程(Python代码)),整个建模流程非常重要的一步,是对于数据的预处理和特征工程,它很大程度决定了最后建模效果的好坏。
算法进阶
2023/09/01
1.5K0
图解机器学习特征工程
【数据竞赛】Kaggle实战之单类别变量特征工程总结!
这是一个系列篇,后续我们会按照我们第一章中的框架进行更新,因为大家平时都较忙,不会定期更新,如有兴趣欢迎长期关注我们的公众号,如有任何建议可以在评论区留言,该系列以往的经典内容可参考下面的篇章。
黄博的机器学习圈子
2021/04/16
1.4K0
【数据竞赛】Kaggle实战之单类别变量特征工程总结!
提高数据质量的步骤
在进行数据分析和建模之前,数据清洗与预处理是至关重要的步骤。通过清洗和预处理数据,我们可以去除噪声、填补缺失值、处理异常值等,从而提高数据质量,确保后续分析的准确性和可靠性。本文将介绍数据清洗与预处理的关键步骤,并分享一些实用的代码示例,帮助您掌握数据清洗和预处理的技巧,提高数据质量,为后续分析奠定坚实基础。
华科云商小孙
2023/10/08
3810
利用Python进行常见的特征工程
上期说到数据分析师一般对业务数据提取的时候就会进行数据清洗,也会做一些业务逻辑或者数据逻辑上的特征处理。但由于特征工程是数据建模重要的一环,所以这里就做一个简单的总结。希望能给大家带来一些小小地帮助~
HsuHeinrich
2023/03/29
1.1K0
利用Python进行常见的特征工程
相关推荐
Pandas 数据分析 5 个实用小技巧
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档