前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >10分钟梳理机器学习基础知识(一)——在意的小问题

10分钟梳理机器学习基础知识(一)——在意的小问题

原创
作者头像
刁寿钧
修改于 2017-10-09 01:50:11
修改于 2017-10-09 01:50:11
2.6K0
举报
文章被收录于专栏:刁寿钧的专栏刁寿钧的专栏

导语:每天10分钟,用去食堂吃饭的时间解决一个知识点。

缘起

笔者目前的岗位与机器学习无关,在学校时修过人工智能的选修课,其实浮于表面,没学到什么技能。在学校的时候一直挺喜欢下棋的(曾经的李世石脑残粉一枚),去年AlphaGo火了一把,因此对机器学习产生了兴趣。看了几本书(“xx入门”,“白话xx与xx”),各种公众号也经常推文章,但术语虽然是熟悉了,还是觉得好像隔着一层。后来修了三门MOOC(板书小王子吴恩达的《Machine Learning》,台大萌娃林轩田的《机器学习基石》与《机器学习技法》),才有种补上了点基础的感觉。

这个系列只是梳理下机器学习用到的部分基础知识,以及自己的管窥之见。有哪里说的不对的话,希望各位猛烈地怼我。

第一篇先列一些贯穿始终的点。

不适定

首先要提的是,机器学习的问题是不适定的。适定性问题要满足下面三个条件:

解是存在的

解是唯一的

解连续地取决于初值条件

我们用机器学习处理的问题,样本只是所有数据的一小部分,解不唯一,所以是一个ill-posed problem。

过拟合

我们用代价函数来衡量假设对训练集的拟合程度。如果我们有非常多的feature,通过学习得到的hypothesis可能完美适应训练集,甚至代价函数为0,但是进行预测时效果就不好了。这就是overfitting,过拟合。与之相对应的就是underfitting,欠拟合。

一般来说,我们的应对思路有两种:

减少feature

可以手动选择保留的特征,也可以使用一些降维的算法,如PCA,可通过发现相关度(协方差)高的特征,转换到低维空间。

正则化

不减少feature,但是给代价函数加一个衡量参数magnitude的项,即regularization parameter,这样可以达到“惩罚”一些特征的效果。

神经网络容易过拟合。像线性模型的参数少,不容易过拟合,这也是它的主要优点。所以满足性能的条件下,模型越简单越好,这是奥卡姆剃刀告诉我们的道理。

凸性

我们在机器学习里经常要考察函数的凸性。这是因为凸函数只有一个极值,即“谷底”。如果我们的代价函数是一个凸函数,那么我们就可以通过梯度下降,逐渐逼近全局最优解,一点一点滑落到谷底。

画个示意图,比如在基于最小二乘法的回归算法中:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
2021全网最全Activiti7教程04(Activiti7进阶篇-欢迎收藏)
  本篇重点给大家介绍下Activiti中的高级内容,比如流程实例,个人任务,流程变量,组任务及网关。
用户4919348
2021/06/17
3.7K1
2021全网最全Activiti7教程04(Activiti7进阶篇-欢迎收藏)
搭建单体SpringBoot项目 集成Activiti7 进阶
一个流程实例包括了所有的运行节点。我们可以利用这个对象来了解当前流程实例的进度等信息。
郭顺发
2023/07/17
6780
搭建单体SpringBoot项目 集成Activiti7 进阶
七万字掌握热门工作流引擎框架Activiti7,附带视频讲解哦
  工作流(Workflow),就是通过计算机对业务流程自动化执行管理。它主要解决的是“使在多个参与者之间按照某种预定义的规则自动进行传递文档、信息或任务的过程,从而实现某个预期的业务目标,或者促使此目标的实现”。文章中涉及的相关软件资料扫左侧哦。
用户4919348
2022/01/07
1.5K0
七万字掌握热门工作流引擎框架Activiti7,附带视频讲解哦
2023最新版本Activiti7系列-网关服务
网关可控制流程的执行流向,常用于拆分或合并复杂的流程场景。在Activiti7中,有以下几种类型的网关:
用户4919348
2023/07/24
5400
2023最新版本Activiti7系列-网关服务
Spring Boot + Activiti 完美结合,快速实现工作流~
关于工作流之前分享过一篇flowable,今天分享一下另外一个实现:Activiti
码猿技术专栏
2023/05/01
1.3K0
Spring Boot + Activiti 完美结合,快速实现工作流~
Activiti7 网关(排他网关)
排他网关(也叫异或(XOR)网关,或叫基于数据的排他网关),用于在流程中实现决策,当流程执行到这个网关,所有分支都会判断条件是否为true,如果为true则执行该分支
彼岸舞
2020/12/01
2.9K0
Spring Boot + Activiti 完美结合,快速实现工作流
关于工作流之前分享过一篇flowable,今天分享一下另外一个实现:Activiti
终码一生
2023/01/08
1.3K0
Spring Boot + Activiti 完美结合,快速实现工作流
Activiti7笔记(一)Activiti7是什么,入门流程操作的代码实现
Activiti是一个工作流引擎, activiti可以将业务系统中复杂的业务流程抽取出来,使用专门的建模语言BPMN2.0进行定义,业务流程按照预先定义的流程进行执行,实现了系统的流程由activiti进行管理,减少业务系统由于流程变更进行系统升级改造的工作量,从而提高系统的健壮性,同时也减少了系统开发维护成本。
一写代码就开心
2022/05/09
3.4K0
Activiti7笔记(一)Activiti7是什么,入门流程操作的代码实现
activiti6.0工作流引擎深度解析_自定义工作流引擎
工作流(Workflow),就是通过计算机对业务流程自动化执行管理。它主要解决的是“使在多个参与者之间按照某种预定义的规则自动进行传递文档、信息或任务的过程,从而实现某个预期的业务目标,或者促使此目标的实现”。
全栈程序员站长
2022/09/27
2.9K0
activiti6.0工作流引擎深度解析_自定义工作流引擎
Activiti7 网关(包含网关)
包含网关可以看做是排他网关和并行网关的结合体,和排他网关一样,你可以在外出顺序流上定义条件,包含网关会解析他们,但是主要的区别是包含网关可以选择多于一条顺序流,这和并行网关是一样的
彼岸舞
2020/12/01
1.7K0
2021全网最全Activiti7教程03(Activiti7基本操作-欢迎收藏)
  将上面在设计器中定义的流程部署到activiti数据库中,就是我们讲的流程部署。 通过调用Activiti的api将流程定义的bpmn和png两个文件一个一个添加部署到activiti中,还可以将两个文件打车zip包部署。
用户4919348
2021/06/17
8700
2021全网最全Activiti7教程03(Activiti7基本操作-欢迎收藏)
如何控制工作流中的流程流转?工作流流程元素之顺序流和网关的详细解析
当前条件表达式只能使用 使用的表达式需要返回boolean值,否则会在解析表达式时抛出异常
攻城狮Chova
2022/01/22
1.5K0
如何控制工作流中的流程流转?工作流流程元素之顺序流和网关的详细解析
【第十一篇】Flowable中的各种网关
  排他网关(exclusive gateway)(也叫异或网关 XOR gateway,或者更专业的,基于数据的排他网关 exclusive data-based gateway),用于对流程中的决策建模。当执行到达这个网关时,会按照所有出口顺序流定义的顺序对它们进行计算。选择第一个条件计算为true的顺序流(当没有设置条件时,认为顺序流为true)继续流程。
用户4919348
2022/04/13
3.1K0
【第十一篇】Flowable中的各种网关
项目实践工作流之Activiti学习(三十九)
在部门经理审核后,走排他网关,从排他网关出来的分支有两条,一条是判断请假天数是否大于 3天,另一条是判断请假天数是否小于等于 3 天。
用户1289394
2023/11/23
2770
项目实践工作流之Activiti学习(三十九)
Activiti7笔记(三)Activiti进阶,什么是流程实例,流程实例相关知识解读
之前一直是activiti这个25张表里面自己操作,就相当于一个demo,现在我们要和自己的业务进行整合
一写代码就开心
2022/05/09
1K0
Activiti7笔记(三)Activiti进阶,什么是流程实例,流程实例相关知识解读
Activiti7笔记(二)Activiti7一共涉及到25张表,哪些操作会涉及哪些表,每张表的作用是什么
第二部分是表示表的用途的两个字母标识。 用途也和服务的 API 对应。 ACT_RE :'RE’表示 repository。 这个前缀的表包含了流程定义和流程静态资源 (图片,规则,等等)。 ACT_RU:'RU’表示 runtime。 这些运行时的表,包含流程实例,任务,变量,异步任务,等运行中的数据。 Activiti 只在流程实例执行过程中保存这些数据, 在流程结束时就会删除这些记录。 这样运行时表可以一直很小速度很快。 ACT_HI:'HI’表示 history。 这些表包含历史数据,比如历史流程实例, 变量,任务等等。 ACT_GE : GE 表示 general。 通用数据, 用于不同场景下
一写代码就开心
2022/05/09
3K0
Activiti7笔记(二)Activiti7一共涉及到25张表,哪些操作会涉及哪些表,每张表的作用是什么
Activiti学习详解【面试+工作】
一:Activiti第一天 1:工作流的概念 说明: 1) 假设:这两张图就是XX兄弟的请假流程图 2) 图的组成部分: A. 人物:范XX 冯X刚 王X军 B. 事件(动作):请假、批准、不批准
Java帮帮
2018/03/15
3.4K0
Activiti学习详解【面试+工作】
史上最全的工作流引擎 Activiti 学习教程(值得收藏)
点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网络应用框架 Netty 源码解析 消息中间件 RocketMQ 源码解析 数据库中间件 Sharding-JDBC 和 MyCAT 源码解析 作业调度中间件 Elastic-Job 源码解析 分布式事务中间件 TCC-Transaction
芋道源码
2022/05/23
2.6K0
史上最全的工作流引擎 Activiti 学习教程(值得收藏)
Activiti就是这么简单
Activiti介绍 什么是Activiti? Activiti5是由Alfresco软件在2010年5月17日发布的业务流程管理(BPM)框架,它是覆盖了业务流程管理、工作流、服务协作等领域的一个开源的、灵活的、易扩展的可执行流程语言框架。Activiti基于Apache许可的开源BPM平台,创始人Tom Baeyens是JBoss jBPM的项目架构师,它特色是提供了eclipse插件,开发人员可以通过插件直接绘画出业务 流程图。. 我们即将学习的是一个业务流程管理框架, 常见开源工作流引擎框架 : O
Java3y
2018/04/02
2.3K1
Activiti就是这么简单
工作流引擎之activiti中的排他网关和并行网关
排他网关.png
lyb-geek
2018/07/26
3.9K0
工作流引擎之activiti中的排他网关和并行网关
推荐阅读
相关推荐
2021全网最全Activiti7教程04(Activiti7进阶篇-欢迎收藏)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档