Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >机器学习特征提取 | 自动特征工程featuretools

机器学习特征提取 | 自动特征工程featuretools

作者头像
码科智能
发布于 2018-01-02 12:35:28
发布于 2018-01-02 12:35:28
1.8K00
代码可运行
举报
运行总次数:0
代码可运行

1、什么是Featuretools?

为了能使框架普适,就像pandas用于数据准备或scikit-learn用于机器学习

链接:https://www.featuretools.com/

2、安装

通过源码安装,代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
git clone https://github.com/featuretools/featuretools.git
cd featuretools
python setup.py install

通过pip安装,命令如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install featuretools

3、五分钟快速开始

1)首先导入相关包:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
In [1]: import featuretools as ft

2)准备相关数据:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
In [2]: data = ft.demo.load_mock_customer()
In [3]: customers_df = data["customers"]
In [5]: sessions_df = data["sessions"]
In [7]: transactions_df = data["transactions"]
In [10]: relationships = [("sessions", "session_id", "transactions", "session_id"),
   ....:                  ("customers", "customer_id", "sessions", "customer_id")]

3)特征综合:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
In [11]: feature_matrix_customers, features_defs = ft.dfs(entities=entities,
   ....:                                                  relationships=relationships,
   ....:                                                  target_entity="customers")

In [12]: feature_matrix_customers
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年11月07日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
特征工程自动化之FeatureTools
特征工程是指以已有的数据为基础,根据专业领域的知识和经验,构造新的特征,获取高效准确的模型的过程。该过程是机器学习的关键,大部分工作需要依靠人力,耗费时间和精力。
MeteoAI
2019/07/24
2.3K0
2022年Python顶级自动化特征工程框架⛵
特征工程(feature engineering)指的是:利用领域知识和现有数据,创造出新的特征,用于机器学习算法。
ShowMeAI
2022/11/14
1.9K0
2022年Python顶级自动化特征工程框架⛵
featuretools,可自动构造机器学习特征的Python库
机器学习模型只能从我们给定的数据中学习,所以构造一个和任务相关的特征是至关重要的。
机器学习AI算法工程
2019/10/28
7380
featuretools,可自动构造机器学习特征的Python库
机器学习“捷径”:自动特征工程全面解析(附代码示例)
在机器学习项目中,特征工程是影响模型性能的关键步骤。它通过从原始数据中提取出更有用的特征,帮助模型更好地捕捉数据中的模式。然而,传统的特征工程过程往往需要大量的领域知识和实验调整,是一项耗时费力的工作。
平凡之路.
2024/10/19
6450
机器学习“捷径”:自动特征工程全面解析(附代码示例)
手动特征工程已经OUT了!自动特征工程才是改进机器学习的方式
【导读】近年来,我们在自动模型选择和超参数调优方面取得了进展,但机器学习流程中最重要的方面-- 特征工程,在很大程度上被我们所忽略。在本文中,我们将使用 Featuretools 库来了解自动化特征工程如何改变并优化机器学习的工作方式。
AI科技大本营
2018/09/28
1.5K0
手动特征工程已经OUT了!自动特征工程才是改进机器学习的方式
机器学习实战 | 自动化特征工程工具Featuretools应用
教程地址:http://www.showmeai.tech/tutorials/41
ShowMeAI
2022/03/22
1.5K0
机器学习实战 | 自动化特征工程工具Featuretools应用
手把手教你用Python实现自动特征工程
任何参与过机器学习比赛的人,都能深深体会特征工程在构建机器学习模型中的重要性,它决定了你在比赛排行榜中的位置。
量子位
2018/09/29
1.3K0
手把手教你用Python实现自动特征工程
AutoML之自动化特征工程
个人以为,机器学习是朝着更高的易用性、更低的技术门槛、更敏捷的开发成本的方向去发展,且AutoML或者AutoDL的发展无疑是最好的证明。因此花费一些时间学习了解了AutoML领域的一些知识,并对AutoML中的技术方案进行归纳整理。
Bo_hemian
2020/09/09
2.2K0
为什么说自动化特征工程将改变机器学习的方式
没有什么是一成不变的,尤其是在数据科学领域。毕竟,一些库、算法、工具一直在更新迭代。
大数据文摘
2019/03/04
6390
为什么说自动化特征工程将改变机器学习的方式
手把手 | 如何用Python做自动化特征工程
机器学习的模型训练越来越自动化,但特征工程还是一个漫长的手动过程,依赖于专业的领域知识,直觉和数据处理。而特征选取恰恰是机器学习重要的先期步骤,虽然不如模型训练那样能产生直接可用的结果。本文作者将使用Python的featuretools库进行自动化特征工程的示例。
大数据文摘
2018/09/20
4.5K0
手把手 | 如何用Python做自动化特征工程
还在苦恼特征工程?不妨试试这个库
从事机器学习相关岗位的同学都知道这样一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。在数据确定的情况下,那么特征工程就成了唯一可供发挥的关键步骤。广义来讲,特征工程包括特征提取、特征衍生以及特征选择等等,今天本文就来分享Python中的一个特征工程相关的库——featuretools,可自动化快速实现特征提取和特征衍生的工作,对加速机器学习建模和保证特征工程效果都非常有帮助。
luanhz
2021/08/20
5520
文末福利|特征工程与数据预处理的四个高级技巧
用于创建新特征,检测异常值,处理不平衡数据和估算缺失值的技术可以说,开发机器学习模型的两个最重要的步骤是特征工程和预处理。特征工程包括特征的创建,而预处理涉及清理数据。
磐创AI
2019/08/26
1.3K0
文末福利|特征工程与数据预处理的四个高级技巧
20个必备的Python机器学习库,建议收藏!
来源丨网络 推荐阅读:终于来了,【第二期】 彭涛Python 爬虫特训营!! AutoML是指自动机器学习。它说明了如何在组织和教育水平上自动化机器学习的端到端过程。机器学习模型基本上包括以下步骤: 数据读取和合并,使其可供使用。 数据预处理是指数据清理和数据整理。 优化功能和模型选择过程的位置。 将其应用于应用程序以预测准确的值。 最初,所有这些步骤都是手动完成的。但是现在随着AutoML的出现,这些步骤可以实现自动化。AutoML当前分为三类: 用于自动参数调整的AutoML(相对基本的类型) 用于非深
sergiojune
2022/09/28
9970
20个必备的Python机器学习库,建议收藏!
可自动构造机器学习特征的Python库
机器学习越来越多地从人工设计模型转向使用 H20、TPOT 和 auto-sklearn 等工具自动优化的工具。这些库以及随机搜索(参见《Random Search for Hyper-Parameter Optimization》)等方法旨在通过寻找匹配数据集的最优模型来简化模型选择和机器学习调优过程,而几乎不需要任何人工干预。然而,特征工程作为机器学习流程中可能最有价值的一个方面,几乎完全是人工的。
刀刀老高
2018/07/24
2K0
可自动构造机器学习特征的Python库
特征工程系列:自动化特征构造
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
木东居士
2019/12/10
1.7K0
特征工程系列:自动化特征构造
一文归纳Python特征生成方法(全)
业内常说数据决定了模型效果上限,而机器学习算法是通过数据特征做出预测的,好的特征可以显著地提升模型效果。这意味着通过特征生成(即从数据设计加工出模型可用特征),是特征工程相当关键的一步。
算法进阶
2022/06/01
1K0
一文归纳Python特征生成方法(全)
人工智能_1_初识_机器学习介绍_特征工程和文本特征提取
# 人工智能:预测,分类 # 人工智能: # 自动的工作 # 机器学习(包含深度学习) # 以前的限制因素:计算能力,数据,算法发展 # 用途: # 图像识别 # 识别图片中不同的地方(医学CT) 不用人工识别 # 图片艺术化(可以替代ps) # 无人驾驶 # 人脸识别 # 自然语言处理 # 语音识别 # 自动写报告 # 传统预测 # 性能评估 # NLP # 推荐系统 # 机器学
Dean0731
2020/05/08
4490
【NLP】使用Google的T5提取文本特征
下图是文本到文本框架的示意图。每个任务都使用文本作为模型的输入,通过训练生成一些目标文本。
黄博的机器学习圈子
2021/07/29
1.6K0
独家 | 用Python Featuretools库实现自动化特征工程(附链接)
本文简要介绍特征工程的基本组成部分,并用直观的示例理解它们,最后给出使用Python Featuretools库实现自动化特征工程的操作过程。
数据派THU
2018/12/11
1.6K0
独家 | 用Python Featuretools库实现自动化特征工程(附链接)
PyCaret 可轻松搞定机器学习!
PyCaret 是由 Moez Ali 创建并于2020年4月发布的 python 开源低代码机器学习库。它只需要使用很少的代码就可以创建整个机器学习管道。
郭好奇同学
2021/08/26
1.1K0
PyCaret 可轻松搞定机器学习!
推荐阅读
相关推荐
特征工程自动化之FeatureTools
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验