前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >入门 | 做数据科学如烤蛋糕?不服来看

入门 | 做数据科学如烤蛋糕?不服来看

作者头像
CDA数据分析师
发布于 2018-10-25 02:33:32
发布于 2018-10-25 02:33:32
5070
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

作者:Azika Amelia

机器之心编译 参与:高璇、王淑婷

本文转自机器之心,转载请授权

数据科学是什么,用来干什么?数据科学使用数学和不同的机器学习方法(也称算法)来实现不同目的。具体来讲,就和烤蛋糕的原理有些类似,至于怎么个类似法,请看作者的详细解说 ↓↓↓

面部识别、自动驾驶、机器人统治世界?!还有那个令人毛骨悚然的机器人女孩,索菲亚。emmm…还有黑镜?

我们想知道它们都是怎么工作的。「这全是人工智能。」是的。但我们想知道更多。

数据科学、人工智能、大数据、机器学习等都是最近的热门词汇。它们大多与谷歌、苹果和亚马逊等大型科技公司有关。

幸运的是,你不用成为一名数据科学家就能对数据科学有所了解。只要你对此热爱、好奇即可。

什么是数据科学?

要事第一!

向亚马逊的聊天机器人寻求答案

数据科学使用数学和不同的机器学习方法(也称算法)来实现不同目的。

机器学习(ML)是编写计算机程序的科学和艺术,它使计算机具有了学习能力。你的计算机现在可以从它观察到的数据中学习,而不是像在传统计算机程序中那样盲目地遵循一套固定规则。你骂电脑是笨蛋的日子一去不复返了。

但是数据科学在哪里发挥作用呢?就在我们身边。Facebook 给你推荐可能认识的人、Youtube 预测股票市场价格的推荐系统,都需要数据科学。

数据科学按照一系列步骤来获得这些答案,而使用机器学习算法只是其中之一。

数据科学流程综述

我们要明白这样一个事实:无论电脑学什么,它都是从数据中学习。将数据视为配料、数据预处理视为食谱、机器学习算法视为烤箱、最终结果视为蛋糕。蛋糕的美味程度取决于原料的质量、食谱和烤箱温度设置。同样地,数据的质量非常重要,你采用的方法也是如此。

数据科学流程抽象图

数据和数据预处理

因此,第一步是收集数据并进行处理。就像你要买食材一样。

还需要确保数据与将要解决的问题相关。弄清楚需要多少数据,以及数据的形式(或格式),就像做蛋糕你要方糖还是砂糖?真实世界的数据集通常以表格形式显示,例如.xls、.csv 或.json 等。

有大量不同的算法可以帮助你进行数据清理和预处理。训练模型的数据会极大地影响模型性能。就像食谱决定蛋糕的味道。

数据集类型

数据集是以适当格式收集所有示例的集合。它可以是一个*标注的*数据集,也可以是一个*未标注的*数据集。

标注的数据集是指具有特征值及其结果的数据集。而未标注的数据集中只有特征值。

特征好比不同的食材,如:牛奶、黄油、糖和鸡蛋是四个不同的特征。这些特征的结果是一个蛋糕。是特征帮你得到结果。

这是真实数据集的样子:

用于预测房价的标注数据集

选择机器学习算法

一旦数据集准备好了,就该使用机器学习算法了。这就是把蛋糕糊放进烤箱。

数据集和标签帮助你确定使用哪种算法。就像如果你想做一些冰淇淋,你需要的不是烤箱而是冰箱。你的配料和配方也会改变。

可供选择的算法

训练、测试、预测!

只学习测试中会出现的题目,你绝对会通过测试。但遇到没见过的题,就不会考得很好了。我们希望模型即使在没见过的例子上也能表现得很好。为了确保这一点,我们采用了一种技术。

我们将数据集分为两组:训练集和测试集。通常以 7:3 的比例来划分,这样有利于训练。

我们的模型仅从训练集的例子中学习。这样划分数据集可以帮助我们评估模型表现,明确提升空间。

训练-测试分解图

测试很简单。你问,模型答,然后给模型打分。它起作用是因为你是在未见过的例子上评估模型。通过的标准取决于你的需求。通常 80% 的通过率是可以达到的。

如果模型在第一次尝试中失败,不要失望,因为在最初的尝试中失败是很正常的。这是因为开始时你总是使用较简单的方法,然后根据测试得分,逐渐增加解决方案的复杂性。但在此之前,请重新评估你的数据集以及它的预处理方式。重复此过程,直到模型通过测试。

测试模型

一旦模型通过测试,就可以投入使用。换句话说,它为实时预测做好了准备。

提示:保持测试集中的数据模式与训练集中的数据模式相同。

数据可视化

既然你已经烤好了蛋糕,而且看起来很好吃,那就该上桌了。也许可以加一些糖霜,把它放在一个漂亮的托盘里等等。让它看起来更美味。

这就是数据可视化。通过制作图表,你可以利用不同的数据可视化技术向受众传达你对数据的理解。数据可视化可以在任何阶段进行,你可以在训练集中绘制现有的基础图案。

就像我说的,你不用成为数据科学家就能对数据科学有所了解。希望你喜欢我刚烤好的「蛋糕」。??

这是我写的第一篇博客。我最近开始了数据科学家的职业生涯。我觉得每个人——即使没有技术背景——都应该了解数据科学的基础知识。但是,大多数数据科学文章都充斥着技术术语,让外行人读起来佶屈聱牙,希望这篇文章能对你有所帮助。

原文链接:

https://blog.goodaudience.com/data-science-a-piece-of-cake-92a70232e71f

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
CSS clip-path 属性
clip-path 是CSS中的一个神奇属性,它能够让你像魔术师一样,对网页元素施展“裁剪魔法”——只展示元素的一部分,隐藏其余部分。想象一下,不用依赖图片编辑软件,直接在浏览器中就能实现元素的各种不规则形状裁剪。✨
空白诗
2024/06/14
2670
CSS clip-path 属性
仅用 CSS 实现赛博朋克 2077 风格视觉效果
《赛博朋克2077》 是一款动作角色类游戏,于 2020年12月10日 登陆各大游戏平台。故事发生在夜之城,权力更迭和身体改造是这里不变的主题。玩家将扮演一名野心勃勃的雇佣兵:V,追寻一种独一无二的植入体——获得永生的关键。它以自由的探索性,较高的操控度以及惊艳的视觉特效收获了一大批玩家。我非常喜欢 2077 官网的设计风格,因此本篇文章主要以 2077 官网为例,通过几个例子,依次实现赛博朋克风格元素效果。
zz_jesse
2021/07/30
5910
2 分钟搞定 3 个现代 CSS 特性
Clip Paths 能把元素元素“裁剪”成特定形状,使用 CSS 提供的 polygon、circle、ellipse 等这些函数实现。举个例子:
Javanx
2020/02/14
5450
每天一个小技巧:CSS clip-path 的妙用 Clip Path分类Clippy
CSS 的 clip-path 属性是 clip 属性的升级版,它们的作用都是对元素进行 “剪裁”,不同的是 clip 只能作用于 position 为 absolute 和 fixed 的元素且剪裁区域只能是正方形,而 clip-path 更加强大,可以以任意形状去裁剪元素,且对元素的定位方式没有要求。基于这样的特性,clip-path 常用于实现一些炫酷的动画效果。
MudOnTire
2020/07/22
4.2K0
每天一个小技巧:CSS clip-path 的妙用
                            Clip Path分类Clippy
CSS 的快乐:画一个可爱的三只小鸟 Button
今天我们就一起来画下这个可爱的 Button 吧!纯 CSS,没用到图片和 JS 呦~
神说要有光zxg
2023/02/01
5670
学习css的clip-path属性
clip-path 是 CSS 的一个属性,它允许你定义一个剪裁区域,用于裁剪元素的显示区域。这个剪裁区域可以是基本形状、SVG 路径、或是外部图像等。被裁剪的元素只会显示在定义的剪裁区域内,超出部分会被隐藏。
心安事随
2024/07/29
1810
学习css的clip-path属性
七夕,当然少不了纯CSS的点缀啦
单身的程序猿或准备脱单的程序猿怎么办,常规操作是const girl = new Object(),没对象就自己创建一个对象过节呗。可是笔者今天想用纯CSS为单调的七夕做一些点缀呢。
JowayYoung
2020/08/26
4070
七夕,当然少不了纯CSS的点缀啦
分享14 个非常实用的CSS技巧
英文 | https://ishratumar.medium.com/14-awesome-css-properties-you-need-to-know-9cee5b364990
前端达人
2022/11/25
1.1K0
分享14 个非常实用的CSS技巧
使用 CSS 轻松实现一些高频出现的奇形怪状按钮
在群里会有同学问相关的问题,怎么样使用 CSS 实现一个内切角按钮呢、怎么样实现一个带箭头的按钮呢?
玖柒的小窝
2021/12/03
1.4K0
使用 CSS 轻松实现一些高频出现的奇形怪状按钮
CSS奇思妙想之-利用CSS裁剪(clip-path)完成各种图形
在日常开发当中,如果想要开发多边形,一般都需要多个盒子或者伪元素的帮助,有没有一直办法能只使用一个盒子实现呢?
肥晨
2023/04/23
1.8K0
CSS 实现“故障”特效
这些效果要是综合运用到业务中应该很吸引眼球。今日早读文章由腾讯@chokcoco投稿分享。
Nealyang
2020/02/19
2.3K0
CSS 实现“故障”特效
30个CSS碎片——这不仅仅是皮囊!
今天小师妹将给大家分享一部由CSS技术实现的作品。它将再一次证明CSS的强大力量。
程序员老鱼
2022/12/02
5900
奇妙的 CSS shapes(CSS图形)
CSS 发展到今天已经越来越强大了。其语法的日新月异,让很多以前完成不了的事情,现在可以非常轻松的做到。今天就向大家介绍几个比较新的强大的 CSS 功能: clip-path shape-outside shape 的意思是图形,CSS shapes 也就是 CSS 图形的意思,也就是使用 CSS 生成各种图形(圆形、矩形、椭圆、多边形等几何图形)。 CSS3之前,我们能做的只有矩形,四四方方,条条框框。 CSS3 CSS3出来后,我们有了更广阔的施展空间,通过 border-radius border
Sb_Coco
2018/05/28
1.5K0
CSS Painting API
本文是 CSS Houdini 之 CSS Painting API 系列第四篇。
Sb_Coco
2022/12/19
1.1K0
CSS Painting API
CSS样式clip-path绘制图形裁剪图片
发现clip-path绘制图形的网站 http://bennettfeely.com/clippy/ 专门介绍clip-path的使用,几乎任何形状都可以做出来,下面使用clip-path制作正三边形至正八边形以及其它图形的方法,并且有些正多边形需要通过一定的计算,顺便放了计算公式。通过应用这些正多边形和其它的形状的实现方法来学习clip-path这个样式。
小弟调调
2018/10/18
1.8K0
CSS样式clip-path绘制图形裁剪图片
纯CSS实现的文字效果竟然可以这么酷炫!
CSS是一门很特殊的语言,你认为CSS只能用来控制网页的结构与样式,但只要你有丰富的想象力,就能创造无限可能。
程序员老鱼
2022/12/02
2.1K0
每个前端开发需要了解的15个强大的CSS属性
这篇文章介绍了15个重要的CSS属性,旨在提高读者的CSS知识和技能。文章以清晰的方式解释了每个属性的作用和用法,并提供了相应的示例代码。通过这篇文章,读者可以了解到一些有趣且实用的CSS属性。
前端小智@大迁世界
2023/07/22
2940
每个前端开发需要了解的15个强大的CSS属性
CSS 奇思妙想边框动画
今天逛博客网站 -- shoptalkshow[1],看到这样一个界面,非常有意思:
微芒不朽
2022/09/13
9260
那些不常见,但却非常实用的css属性(整理不易)
可以把 块容器 中的内容限制为指定的行数。并且在超过行数后,在最后一行显示"..."
winty
2020/06/16
2.4K0
那些不常见,但却非常实用的css属性(整理不易)
【前端艺术】纯CSS3鼠标hover图片条纹遮罩层动画效果源码
这是一款纯CSS3鼠标hover图片条纹遮罩层动画特效。该特效在鼠标悬停图片上面时,背景遮罩层变形为棱形,中间显示图片,旁边是紫色条纹。同时展示图片的描述文字和链接图标等。
用户5997198
2019/08/09
1.3K0
【前端艺术】纯CSS3鼠标hover图片条纹遮罩层动画效果源码
相关推荐
CSS clip-path 属性
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档