前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用于入门的最佳机器学习资源

用于入门的最佳机器学习资源

作者头像
天空
发布于 2018-02-07 09:32:52
发布于 2018-02-07 09:32:52
1.2K0
举报

这是一个非常难写的文章,因为我希望它是真正有价值的。

我坐着在一张空白的页面上提了一个真正困难的问题,什么是最好的函数库,课程,论文和书籍? 我会推荐给机器学习领域的真正初学者。

我真的为该包括什么和排除什么而苦恼。我必须努力把自己置身于程序员和初学者的机器学习之中,并思考哪些资源最有利于他们。

我为每种资源选择最好的。如果你是一个真正的初学者,并且兴奋地开始在机器学习领域,我希望你找到一些有用的东西。我的建议是挑选一件东西,一本书或一个函数库,并阅读封面以涵盖所有的教程。选择一个,坚持下去,然后一旦你掌握了,选择另一个,然后重复。让我们进入它。

编程库

我是“学到可以构成威胁即止,开始小试身手"一个倡导者,。

这就是我学习编程的方法,我相信很多其他人也是这样学习的。了解你的局限性,充分利用你的优势。如果您知道如何编程,可以利用它来快速深入机器学习。那么在实现它的生产系统之前,要有条理地去学习有关技术的数学。

找到一个库,阅读文档,按照教程,开始尝试。以下是最好的开源机器学习编程库。我不认为它们都适合在您的生产系统中使用,但它们是学习,探索和原型设计的理想选择。

从一个你熟悉的语言库开始,然后转到其他更强大的库。如果你是一名优秀的程序员,你可以很容易地从语言转换为语言。这是完全相同的逻辑,只是语法和API不同。

  • 用于统计计算的R项目:这是一个环境和一个类似lisp的脚本语言。所有你可能想要做的统计资料将被提供给R,包括优秀的策划。CRAN上的机器学习类(考虑:第三方机器学习软件包)由领导者在现场使用最先进的方法编写的代码,以及任何你能想到的东西。学习R是必须的,如果你想快速探索原型。这可能不是你开始的第一个地方。
  • WEKA:这是一个提供API的数据挖掘工作台,以及用于整个数据挖掘生命周期的大量命令行和图形用户界面。您可以准备数据,可视化探索,构建分类,回归和聚类模型,许多算法都内置在第三方插件中。与WEKA无关, Mahout是在Hadoop基础架构上进行机器学习的一个很好的Java框架,如果这更符合您的需求的话。如果您是大数据和机器学习的新手,请坚持使用WEKA并一次学习一件事。
  • Scikit学习:基于NumPy和SciPy构建的Python中的机器学习。如果你是一个Python或Ruby程序员,这是你的函数库。这是友好的,功能强大,并提供优秀的文档。如果你想尝试别的,Orange将是一个很好的选择。
  • Octave:如果你熟悉MatLab或者你是一个NumPy程序员寻找不同的东西,可以考虑Octave。这是一个像Matlab一样的数值计算环境,可以很容易地编写程序来解决线性和非线性问题,比如大多数机器学习算法的基础问题。如果你有工科背景,这可能是你开始的好地方。
  • BigML:也许你不想做任何编程。您可以完全不用编程就可以像WEKA一样驱动工具。您可以进一步使用BigML等服务,在Web上提供机器学习界面,您可以在浏览器中浏览构建模型。

选择一个平台,并用它来完成你的机器学习教育。不要只是读,做。

视频课程

在机器学习中,视频是一种非常流行的入门方式。

我在YouTube和VideoLectures.Net上观看了很多机器学习视频。风险就是你所要做的就是消费,不能采取行动。我建议你在观看视频的时候应该记笔记,即使你稍后放弃笔记。我也建议你尝试一下你在课堂中学到的东西。

坦率地说,我所见过的所有视频课程都不适合初学者,对于一个真正的初学者。它们都预设了至少线性代数和概率论的工作知识,等等。

Andrew Ng的斯坦福大学讲座可能是开设课程的最佳地点,否则我会推荐一次性的视频。

  • 斯坦福机器学习:可通过Coursera和Andrew Ng任教。除了报名外,您还可以随时观看所有讲座,并从实际的斯坦福大学CS229课程中获得讲义和课堂笔记。本课程包括作业和测验,并重点介绍线性代数和使用八度。
  • 加州理工学院从数据中学习:可通过edX获得并由Yaser Abu-Mostafa授课。所有讲座和材料都可以在CalTech网站上找到。再次,像斯坦福大学的课程一样,您可以按照自己的节奏来完成课内外地作业。它涵盖了类似的主题,并进入了一个更多的细节和数学。家庭作业对于初学者来说可能有点难。
  • VideoLectures.Net上的机器学习分类:这是一个容易在内容过载中淹没的地方。找一些看起来很有意思的视频并试用一下。如果不适合自己,请放弃,如果你喜欢,请记下。自己是不是地回来,重新思考主题,并提出全新的话题。此外,很高兴看到这个领域的大师们是什么样的。

概述论文

如果你不习惯阅读研究论文,你会发现语言非常僵硬。一篇论文就像是一本教科书的片段,但描述了一个实验或者其他一些领域。尽管如此,如果您想要开始机器学习,您可能会发现一些有趣的论文。

  • 机器学习的学科:汤姆·米切尔定义机器学习的一门白皮书。这是米切尔用来说服CMU总裁创建一个独立的机器学习部门的一个论点,这个部门仍将在100年左右的时间里出现(也见Tom Mitchell的这个简短的采访)。
  • 关于机器学习的一些有用的知识:这是一个很好的论文,因为它从特定的算法中退出,并激发了一些重要的问题,如特征选择泛化和模型简单。从一开始就从正确的角度思考,这是一件好事。

我只列出了两篇重要的论文,因为看论文真的会让你沮丧。

初学者机器学习书籍

有很多机器学习书籍,为初学者编写的书籍很少。

什么是真正的初学者?

最有可能的是,你要来自另一个领域的机器学习,很可能是计算机科学,编程或统计学。即使如此,大多数书籍都希望你至少有线性代数和概率论的基础。

尽管如此,有一些书鼓励渴望的程序员通过教授算法的最低直觉来开始,并指向工具和库,以便可以跑出去尝试一下。

最值得注意的是集体智慧编程黑客机器学习数据挖掘:分别用于Python,R和Java的实用机器学习工具和技术。如果有疑问,请抓住这三本书中的一本!

初学者学习机器学习的书籍

  • 编程集体智能:构建智能Web 2.0应用程序:本书是为亲爱的程序员您编写的。这是理论上的轻量级,重在代码示例和实际的网络问题和解决方案。买它,读它,做练习。
  • 黑客机器学习:在阅读集体智慧编程(上文)之后,我会推荐这本书 。它再次提供了实用的工作实例,但它更多的是一个数据分析的味道,并使用地是R.我真的很喜欢这本书!
  • 机器学习:一个算法的角度。这本书就像编程集体智慧的更高级版本 (上图)。它有类似的目标(让机器学习开始的程序员),但它包括数学和参考,以及在Python中的例子和片段。如果你仍然感兴趣,我建议阅读编程集体智慧后阅读。
  • 数据挖掘:实用机器学习工具和技术,第三版:我实际上是从这本书开始的,实际上它是第一版,大约是2000年。我是一个Java程序员,这本书和随书库WEKA为我提供了一个完美的环境,可以将我自己的算法作为插件来实现,并且通常练习机器学习和更广泛的数据挖掘过程。我强烈推荐这本书和这方向。
  • 机器学习:这是一本旧书,包括公式和大量的参考文献。这是一本教科书,但对于每种算法都有很强的动机。

很多人都在谈论一些很棒的机器学习教科书。我想对于初学者来说,这不是一个好地方。。

进一步阅读

我深深地思考了这篇文章,我也去看了其他人的资源清单,以确保我没有错过任何重要的事情。

为了完整起见,下面是网络上一些关于机器学习入门的大量资源清单。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【陆勤践行】机器学习最佳入门学习资料汇总
这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门? 资源的取舍很让人纠结,我不得不努力从一个机器学习的程序员和初学者的角度去思考哪些资源才是最适合他们的。 我为每种类型的资源选出了其中最佳的学习资料。如果你是一个真正的初学者,并且有兴趣开始机器学习领域的学习,我希望你能在其中找到有用的东西。我的建议是,选取其中一项资源,一本书,或者一个库,从头到尾的读一边,或者完
陆勤_数据人网
2018/02/26
6270
最佳机器学习入门级资源
这是一篇非常难写的文章,同时我希望这篇文章对于入门学习的朋友是真正有价值、有帮助的。
青蛙跳
2018/02/05
1.2K0
机器学习自学指南
有很多途径来学习机器学习。有丰富的资源:有书籍,有课程可以参与,可以参加比赛,有大量供你使用的工具。在这篇文章中,我想围绕这些活动提出一些你机器学习之旅大致会有的阶段并在你程序员通往到机器学习大师之路上给出一个大概的顺序,以及在各个层次上有哪些可供你利用的资源
xixigiggling
2018/02/07
5800
“机器学习”自学手册
在自学“机器学习”方面,你能做的事其实很多。你可以参考一些书籍或者相关的课程、参加一些竞赛,或者使用一些你能用到的相关的工具等等。在本文中,我将结构性的阐述一下自学的方法,并且我会给出一些在从新手到老手的晋升途径中常常会遇到的问题的解决方案。
KX_WEN
2018/02/02
1.4K0
机器学习自学指南
你有许多方法和资源来学习机器学习:阅读书籍、学习课程、参加比赛和各种可用的工具。在这篇文章中,我想使这些活动更为体系化,并列出一个大致的顺序,以说明在普通程序员到机器学习高手的过程中所要着手什么。
2018/02/06
1.1K0
【干货】近200篇机器学习&深度学习资料分享(上)
编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等。而且原文也会不定期的更新,望看到文章的朋友能够学到更多。 《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Learning. 《Deep Learning in Neural Networks: An Overview》 介绍:这是瑞士人工智能实验室 Jurgen Schmid
小莹莹
2018/04/23
1.1K0
【干货】近200篇机器学习&深度学习资料分享(上)
自学机器学习向导
这里,你在学习机器学习的过程中,可以做很多的事情。这里有很多来自书籍和课程的资源给你提供参考,甚至你可以参加比赛和属性使用工具。在这篇文章里,我想对这些活动提供一些架构,并在你从程序员转变为机器学习专家的旅途中给你提供一些自由的顺序来解决一些问题。 机器学习的等级 考虑一下四个机器学习的技能等级,而这时一个模型,有助于我们思考这些可靠的资源和活动,而且说不定在什么时候能派上用场。 1.新手 2.初级 3.中级 4.高级 我这里想要把新手和初级分开来讨论就是因为我想要在这些绝对新手(一个在某个领域感兴趣的程序
CDA数据分析师
2018/02/08
7490
【陆勤践行】数据挖掘从入门到进阶
做数据挖掘也有些年头了,写这篇文一方面是写篇文,给有个朋友作为数据挖掘方面的参考,另一方面也是有抛砖引玉之意,希望能够和一些大牛交流,相互促进,让大家见笑了。 入门: 数据挖掘入门的书籍,中文的大体有这些: JiaweiHan的《数据挖掘概念与技术》 IanH.Witten/EibeFrank的《数据挖掘实用机器学习技术》 TomMitchell的《机器学习》 TOBYSEGARAN的《集体智慧编程》 AnandRajaraman的《大数据》 Pang-NingTan的《数据挖掘导论》 MatthewA.R
陆勤_数据人网
2018/02/26
7570
【陆勤阅读】浅析:数据挖掘从入门到进阶,要看什么书?
做数据挖掘也有些年头了,写这篇文一方面是让我写篇文,朋友作为数据挖掘方面的参考,另一方面也是有抛砖引玉之意,希望能够和一些大牛交流,相互促进,让大家见笑了。 Q&A: Q:学习,最近在看集体智慧编程,
陆勤_数据人网
2018/02/26
7370
大牛推荐的6本机器学习经典必读书
周老师这本书用来当教材确实不错,不过自学的话跟李航老师的《统计学习方法》来比,确实不够详细,但周老师的书广度上要更加广泛。
一墨编程学习
2019/04/18
9.3K0
从机器学习开始的4个步骤:初学者开始和实践的自上而下的策略
在这篇文章中,我向你展示了采用自顶向下的策略来入门应用机器学习的方法。我可以看到这个方法分为四个步骤。你应该对这些步骤他们感到熟悉,因为它可能跟你用来学习编程的自上而下的方法相同,亦即,掌握基础知识,大量练习,然后在你找到感觉、进入状态后再深入细节。
花落花飞去
2018/02/05
1.8K0
一篇文章解决机器学习,深度学习入门疑惑
研究生有不少日子,和之前的几个学长以及几个学弟偶尔也聊聊天。大部分聊的话题无关乎这几年大火的机器学习深度学习神经网络,而这篇文章的目的,则是从学生的角度(不管是研究生还是即将步入研究生的本科生)来看待这个大方向和大趋势,也是为了替那些刚入门或者准备入门机器学习、深度学习、计算机视觉、图像处理、语音识别及处理等等等相关方向的童鞋,或者研一童鞋学习相关方向迷茫者了清一些基本的概念,以及解决这些“名词”代表什么,应该怎么选择,怎么入门的问题,毕竟谁当年也迷茫过,多一些传承,就少走一些弯路。
老潘
2018/06/21
1.4K0
一篇文章解决机器学习,深度学习入门疑惑
如何充分利用机器学习的书籍和课程
如今,在网上网下,我们有许多机器学习书籍和课程可用来学习,而同时网上又掀起了大学课程和电子书逐渐免费的趋势。太多的优秀资源可以使用也许会让您感觉到要被压倒。而这样的感觉可能会阻止您开始机器学习或在机器学习上取得进展。
花落花飞去
2018/02/07
5930
如何充分利用机器学习的书籍和课程
【机器学习】从零实现来理解机器学习算法
从零开始实现机器学习算法的好处 我推广了从零开始实现机器学习算法的观念。 我认为你可以学到很多关于算法是如何工作的。我也认为,作为一名开发者,它提供了一个学习用于机器学习的数学符号、描述以及直觉的桥梁。 在“从零开始实现机器学习算法的好处”这篇文章里,我已经讨论了从零实现机器学习算法的好处。 在那篇文章,我列出的好处如下: 你获取了知识; 它提供了一个起点; 拥有算法和代码的所属权。 在这篇文章中,我对如何利用现有的教程和书籍来缩短这个学习过程表达了一些个人看法。有一些用于初学的丰富资源,但也要堤防一些绊脚
陆勤_数据人网
2018/02/26
9260
【机器学习】从零实现来理解机器学习算法
深度学习、机器学习相关课程视频汇总
1、斯坦福大学 Andrew Ng 机器学习 (Machine Learning) 该课程已经在Coursera新的课程平台上发布(https://www.coursera.org/learn/machine-learning),在线的课程资源依然会得到保留,优先推荐在线学习,可以做练习,可以提交作业,这里分享的百度网盘资源包含两个版本,来自于之前大家的分享: 链接: https://pan.baidu.com/s/1bBVtIQ 密码: 26hc 机器学习入门课程首选,斯坦福大学教授,Coursera联合
朱晓霞
2018/04/18
1.4K2
机器学习入门方法与资源整合分享
来源商业新知,原标题:机器学习入门方法和资料合集 | 资源 近些天经常有小伙伴问到“机器学习如何入门,看哪些资料 ?”,于是乎想根据笔者学习两年多的学习经验,介绍下机器学习如何入门,该看哪些资料?下面
商业新知
2019/04/04
5520
机器学习入门方法与资源整合分享
【NLP】NLP爱好者学习资源推荐汇总
导读:本文旨在整理汇总一些NLPer的学习资源,包括书籍、在线课程、博客等。本文中涉及的原始失效链接均已剔除或替换,博客部分均整理为近期仍在更新的博客,欢迎文末留言区交流补充。
黄博的机器学习圈子
2021/04/16
2.4K0
【NLP】NLP爱好者学习资源推荐汇总
【教程】深度学习全网最全学习资料汇总之入门篇
【AI研习社】关注AI前沿、开发技巧及技术教程等方面的内容。欢迎技术开发类文章、视频教程等内容投稿,邮件发送至:zhangxian@leiphone.com ———————————————————— 作为人工智能领域一个重要的研究分支,深度学习技术几乎出现在当下所有热门的AI应用领域,包括语音识别,语义理解,图像识别,大数据分析等等,甚至有人把当前的人工智能等同于深度学习。面对如此重要的江湖地位,我们相信一定有为数众多的 AI 开发者对深度学习技术充满了好奇心,想要快速着手使用这项强大的
AI研习社
2018/03/29
1.3K0
【教程】深度学习全网最全学习资料汇总之入门篇
如何在业余时间学习数据分析?
我是一个web前端开发者和rails程序员,计算机专业出身,掌握Python、Ruby、C、Java编程语言,具有较为扎实的计算机理论基础。 现在工作之外的时间里想学习一下数据分析或者数据挖掘。现在大数据这个词搞得蛮火的,不少公司也有在招聘数据分析员。 抱着「技多不压身」的想法我也想稍微学习一下。说不定以后的工作也会需要。我稍微了解了一下,数据分析最基础就是用excel来工作。不过我计算机专业出身的人,还是想通过用编程语言的方法来学习。听说R语言不错,我也稍微了解了一下。 不过现在要学数据分析的话
机器学习AI算法工程
2018/03/12
9120
近200篇机器学习&深度学习资料分享(含各种文档,视频,源码等)
《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Learning. 《Deep Learning in Neural Networks: An Overview》 介绍:这是瑞士人工智能实验室 Jurgen Schmidhuber 写的最新版本《神经网络与深度学习综述》本综述的特点是以时间排序,从 1940 年开始讲起,到 60-80 年代,80-90 年代,
我是攻城师
2018/05/11
1.8K0
相关推荐
【陆勤践行】机器学习最佳入门学习资料汇总
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档