Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >一文总结学习机器学习的12张思维导图|干货

一文总结学习机器学习的12张思维导图|干货

作者头像
磐创AI
发布于 2019-06-25 09:42:04
发布于 2019-06-25 09:42:04
2K0
举报

【磐创AI导读】本文以思维导图的方式,为大家介绍了机器学习的主要知识内容,涵盖了包含机器学习算法特征工程机器学习实战项目深度学习等知识。本文的主要知识内容源于七月在线的《机器学习第九期》课程,另感谢学员海阔天空同学的学习笔记。想了解更多关于该机器学习课程的信息,请点击文末阅读原文,了解获取100G机器学习干货资源。公众号后台回复关键字“0621”获取已经打包好的全部导图文件。

1. 思维导图总览

本知识导图涵盖了机器学习的主要核心知识,具体包括:基本模型(回归决策树随机森林SVM最大熵与EM算法)、特征工程、工业实战Skearn与机器学习实战高级工具库xgboost/lightGBM与建模实战推荐系统原理及应用聚类算法)、深入机器学习(贝叶斯网络隐马可夫链HMM主题模型)、迈入深度学习(深度学习模型与应用循环神经网络与应用卷积神经网络计算机视觉)等。(公众号中回复关键字“0621”获取为大家打包好的全部清晰导图文件

2. 特征工程

特征工程其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。本特征工程思维导图涵盖的知识点包括:特征工程的意义数据的采集数据的处理数据的清洗和采样)、数值型类别型时间型文本型统计型组合型特征的处理特征的选择和降维

3.多算法组合与模型最优

多算法组合和模型调优也是特征工程重要的一部分。本多算法组合与模型调优思维导图包含:模型选择(模型选择的准备工作、模型参数和超参数的选择)、模型效果的优化(模型状态分析、线性模型的权重分析Bad-case分析模型融合)。

4.多算法组合与模型最优Skearn与机器学习实战

我们知道sklearn是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预处理到训练模型的各个方面。本导图从skearn的基本概念出发再到完整的实战项目,为大家介绍了当面对实际机器学习项目时,如何分析项目、划定问题,如何对数据集分类、进行数据分析数据处理,最后如何去选择模型、进行模型的评估优化

5.高级工具库xgboost LightGBM与建模实战

XGBoost 是boosting算法的其中之一,是处理标准表格类数据的主要模型,在目前的许多Kaggle比赛中占据主导地位。而LightGBM则是针对XGboost训练耗时很长,内存占用比较大的缺点,通过使用基于分布式学习算法的决策树,比xgboost训练更快、内存占用更低,还支持并行学习。本思维导图为大家详细的介绍了xgboost和LightGBM的特点参数用法实战等内容。

6.推荐系统原理与应用

推荐系统是一个相当火热的研究方向,在工业界和学术界都得到了大家的广泛关注。本导图为大家详细介绍了推荐系统的概述与评估、经典的推荐系统案例:Netflix推荐算法精讲(基于内容推荐、协同过滤推荐、隐语义模型用户行为序列Word2vector),最后是一些关于推荐系统的细节知识。

7.聚类算法

聚类算法是把距离作为特征,通过自下而上的迭代方式(距离对比),快速地把一群样本分成几个类别的过程。本导图为大家介绍了K-means层次聚类GMM三种聚类算法。

8.贝叶斯网络

贝叶斯网络是一种信念网,基于有向无环图来刻画属性之间的依赖关系的一种网络结构,并使用条件概率表(CPT)来描述联合概率分布。本导图从网络的概念讲起,为大家介绍了贝叶斯网络的优点、例子(朴素贝叶斯隐马尔科夫模型),最后又为大家补充了有关条件独立有向分割的知识点。

9.隐马可夫链(HMM)

马尔可夫链是指数学中具有马尔可夫性质的离散事件随机过程,而隐马可夫模型是一种统计模型,用来描述一个含有隐含未知参数马尔可夫过程,并在自然语言处理语音识别中都有着极其广泛的应用。具体内容如下所示:

10.主题模型LDA

主题模型是一种无监督的贝叶斯模型,常用来做文本分类,在机器学习领域占有重要的地位。本导图介绍了LDA的概念、从三个方面帮大家深入理解了LDA,最后是一个有趣的实战:一眼帮助看穿希拉里的邮件。具体内容如下:

11.深度学习初步

主要包括:深度学习的应用(图像方面NLP方面)、深度学习基础知识(线性分类器通用学习框架)以及神经网络的基础知识。具体的思维导图如下所示:

12.卷积神经网络与计算机视觉

本导图详细的讲解了CNN层级结构(数据输入层、卷积计算层、激励层、池化层、全连接层)、训练算法、如何防止过拟合训练调优模型评价,最后为大家介绍了七种典型的模型结构:

Lenet ALexnet ZF Net GoogleLeNet VGG ResNetDenseNet

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 磐创AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
12张思维导图带你掌握机器学习!
【导读】大家好,我是泳鱼。本文通过12张思维导图,涵盖了包含机器学习算法、特征工程、机器学习实战项目、深度学习等知识,带领大家系统了解及掌握机器学习的主要知识内容!
算法进阶
2023/10/26
1.1K1
12张思维导图带你掌握机器学习!
【干货】机器学习常用 35 大算法盘点(附思维导图)
【新智元导读】本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然,本文收录的算法并不完全,分类的方式也不唯一。不过,看完这篇文章后,下次再有算法提起,你想不起它长处和用处的可能性就很低了。本文还附有两张算法思维导图供学习使用。 在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式或功能分类。在阅读完本文以后,你将会对监督学习中最受欢迎的机器学习算法,以及它们彼此
新智元
2018/03/23
1.9K0
【干货】机器学习常用 35 大算法盘点(附思维导图)
【Github】ML-NLP:机器学习、NLP面试中常考到的知识点和代码实现
此项目是机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
代码医生工作室
2019/09/16
1.5K0
机器学习11:机器学习算法目录(前)
1,误差:误差由偏差(bias)、方差(variance)和噪声(noise)组成;
用户5473628
2019/08/08
8000
[机器学习篇]机器学习知识总结篇
4、Python基础1 - Python及其数学库 解释器Python2.7与IDE:Anaconda/Pycharm Python基础:列表/元组/字典/类/文件 Taylor展式的代码实现 numpy/scipy/matplotlib/panda的介绍和典型使用 多元高斯分布 泊松分布、幂律分布 典型图像处理
统计学家
2019/04/08
9110
吴恩达机器学习丨思维导图丨坚持打卡23天
机器学习是目前信息技术中最激动人心的方向之一。本文以吴恩达老师的机器学习课程为主线,使用 Process On 在线绘图构建机器学习的思维导图。
AXYZdong
2022/05/05
3740
吴恩达机器学习丨思维导图丨坚持打卡23天
开源!《AI 算法工程师手册》中文教程正式发布!
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/red_stone1/article/details/90039822
红色石头
2019/05/25
5860
开源!《AI 算法工程师手册》中文教程正式发布!
这本《AI 算法工程师手册》已正式开源,无需购买纸质书籍,可以直接在线阅读,体验感爆棚。在线阅读地址为:
AI科技大本营
2019/05/15
1.1K0
坚持打卡23天可以做什么丨吴恩达机器学习丨思维导图
机器学习是目前信息技术中最激动人心的方向之一。本文以吴恩达老师的机器学习课程为主线,使用 Process On 在线绘图构建机器学习的思维导图。
AXYZdong
2022/02/16
3670
坚持打卡23天可以做什么丨吴恩达机器学习丨思维导图
《AI 算法工程师手册》正式开源!
之前我曾在《分享集锦:哈佛 Web 开发教程、HTTP 状态码速学、阿里 AI 算法工程师手册、机器学习书籍》中提及过一本由阿里巴巴工程师撰写的一本算法手册,前两天看到红色石头写了一篇较为详细的文章来介绍这边手册,今天转给大家看下。
GitHubDaily
2019/07/10
7530
《AI 算法工程师手册》正式开源!
Python3 机器学习简明教程
1 机器学习介绍     1.1 什么是机器学习     1.2 机器学习的应用     1.3 机器学习基本流程与工作环节         1.3.1 数据采集与标记         1.3.2 数据清洗         1.3.3 特征选择         1.3.4 模型选择         1.3.5 训练和测试         1.3.6 模型使用     1.4 机器学习算法一览 2 Python 3 机器学习软件包     2.1 多种机器学习编程语言比较     2.2 开发环境 Anaconda 搭建         2.2.1 Windows         2.2.2 macOS         2.2.3 Linux     2.3 Jupyter Notebook 介绍     2.4 Spyder 介绍     2.5 Numpy 介绍         2.5.1 Numpy 数组         2.5.2 Numpy 运算         2.5.3 Numpy Cheat Sheet     2.6 Pandas 介绍         2.6.1 十分钟入门 pandas         2.6.2 Pandas Cheat Sheet     2.7 Matplotilb 介绍         2.7.1 Pyplot 教程         2.7.2 plots 示例         2.7.3 Matplotilb Cheat Sheet     2.8 scikit-learn 介绍         2.8.1 scikit-learn 教程         2.8.2 scikit-learn 接口         2.8.3 scikit-learn Cheat Sheet     2.9 数据预处理         2.9.1 导入数据集         2.9.2 缺失数据         2.9.3 分类数据         2.9.4 数据划分         2.9.5 特征缩放         2.9.6 数据预处理模板 3 回归     3.1 简单线性回归         3.1.1 算法原理         3.1.2 预测函数         3.1.3 成本函数         3.1.4 回归模板     3.2 多元线性回归     3.3 多项式回归         3.3.1 案例:预测员工薪水     3.4 正则化         3.4.1 岭回归         3.4.2 Lasso 回归     3.5 评估回归模型的表现         3.5.1 R平方         3.5.2 广义R平方         3.5.3 回归模型性能评价及选择         3.5.4 回归模型系数的含义 4 分类     4.1 逻辑回归         4.1.1 算法原理         4.1.2 多元分类         4.1.3 分类代码模板         4.1.4 分类模板     4.2 k-近邻         4.2.1 算法原理         4.2.2 变种     4.3 支持向量机         4.3.1 算法原理         4.3.2 二分类线性可分         4.3.3 二分类线性不可分支持         4.3.4 多分类支持向量机         4.3.5 Kernel SVM - 原理         4.3.6 高维投射         4.3.7 核技巧         4.3.8 核函数的类型     4.4 决策树         4.4.1 算法原理         4.4.2 剪枝与控制过拟合         4.4.3 信息增益         4.4.4 最大熵与EM算法 5 聚类     5.1 扁平聚类         5.1.1 k 均值         5.1.2 k-medoids     5.2 层次聚类         5.2.1 Single-Linkage         5.2.2 Complete-Linkage 6 关联规则     6.1 关联规则学习     6.2 先验算法Apriori     6.3 FP Growth 7 降维     7.1 PCA(主成分分析)     7.2 核 PCA     7.3 等距特征映射IsoMap 8 强化学习     8.1 置信区间上界算法         8.1.1 多臂老虎机问题
iOSDevLog
2019/02/20
8850
【技术分享】机器学习知识体系
导语:高中的时候,班主任让我们每学完一个章节,整理出这个章节的关键词和一份问题列表。现在回想起来,其实是很有用的,这让我们可以从另外一个视角来审视所学习的内容,而不是单纯的填鸭式的记忆;最近在复习机器学习相关内容,也从问题的视角来回顾机器学习知识体系,对于机器学习方向同学可以作为考察,看看里面的内容是否都能回答上来;而对于想学习机器学习的同学来说,应该可以作为一个方向,把这些内容一个个解决了,在各大厂算法岗面试中应该可以横着走了啦啦啦!
腾讯云TI平台
2019/08/02
2.2K2
机器学习面试
为什么LR需要归一化或者取对数,为什么LR把特征离散化后效果更好,为什么把特征组合之后还能提升,反正这些基本都是增强了特征的表达能力,或者说更容易线性可分吧 naive bayes和logistic regression的区别http://m.blog.csdn.net/blog/muye5/19409615
AomanHao
2022/01/14
5230
机器学习入门必读:6种简单实用算法及学习曲线、思维导图
导读:大部分的机器学习算法主要用来解决两类问题——分类问题和回归问题。在本文当中,我们介绍一些简单但经典实用的传统机器学习算法,让大家对机器学习算法有一个基本的感性认识。
IT阅读排行榜
2020/01/17
4960
机器学习入门必读:6种简单实用算法及学习曲线、思维导图
机器学习在热门微博推荐系统的应用
作者 | 侯雷平、苏传捷、朱红垒 责编 | 何永灿 近年来,机器学习在搜索、广告、推荐等领域取得了非常突出的成果,成为最引人注目的技术热点之一。微博也在机器学习方面做了广泛的探索,其中在推荐领域,将机器学习技术应用于微博最主要的产品之一——热门微博,并取得了显著的效果提升。 热门微博推荐系统介绍 热门微博业务场景 热门微博是基于微博原生内容的个性化兴趣阅读产品。提供最新最热优质内容阅读服务,更好地保障用户阅读效率和质量,同时达到激励微博上内容作者更好的创作和推广内容。 热门微博的推荐系统主要面临以下两点挑
用户1737318
2018/06/05
2K0
机器学习(36)之协同过滤典型算法概述【精华】
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 前言 推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结,后续也会对一些典型的协同过滤推荐算法做原理总结。 推荐算法概述 推荐算法是非常古老的,在机器学习还没有兴起的时候就有需求和应用了。概括来说,可以分为以下5种: 1)基于内容的推荐:这一类一般依赖于自然
昱良
2018/04/04
1.9K0
这里有 300 篇 Python 与机器学习类原创笔记
主要包括计算机科学中基本的算法与数据结构,结合算法思想和Leetcode实战,总结介绍。
好好学java
2020/03/17
4.7K0
人工智能AI(1)开篇:小白之学习计划
本文主要介绍了如何学习人工智能相关知识,包括入门基础、进阶和高阶知识。首先,介绍了计算机基础、编程语言和数学基础。其次,介绍了机器学习、深度学习以及深度学习框架。最后,阐述了机器学习、强化学习、迁移学习等方面的知识。
企鹅号小编
2017/12/29
1.7K0
人工智能AI(1)开篇:小白之学习计划
机器学习算法地图2021版
为了帮助大家理清机器学习的知识脉络,建立整体的知识结构,2018年SIGAI推出过机器学习算法地图,纸质版和电子版的阅读量超过10万。两年之后,我们对算法地图进行了优化升级,使得它的结构更为合理清晰,内容更为简洁。下面先看算法地图2021版的整图
SIGAI学习与实践平台
2021/03/22
1.1K0
机器学习算法地图2021版
《AI 算法工程师手册》:从数学基础到统计学习一网打尽
一位优秀的AI算法工程师应该有强大的数学基础,根据资料,线性代数你要会向量操作、矩阵运算以及特殊函数。概率论相关知识点,要掌握概率与分布、期望和方差、大数定律及中心极限定理、常见概率分布、先验分布与后验分布、信息论。
大数据文摘
2019/05/22
5970
推荐阅读
相关推荐
12张思维导图带你掌握机器学习!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档