Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >入门AI不是梦?五大新手项目奉上

入门AI不是梦?五大新手项目奉上

作者头像
商业新知
修改于 2019-04-24 03:17:52
修改于 2019-04-24 03:17:52
6970
举报
文章被收录于专栏:AI人工智能AI人工智能

来源商业新知网,原标题:如何入门AI?五大新手项目奉上

这年头不学点AI知识,可能都不好意思说自己是新时代的接班人了。

人工智能风头正盛,无论你是支持还是怀疑,AI对这个时代的影响都已逐渐渗透到各行各业当中,哪怕身处非互联网行业,也能感受到AI的滚滚浪潮。

学习已成刚需,不过对于初学者而言,要正正经经上手机器学习,如何入门就有点让人头大了。

好在计算机领域向来有和谐互助之风,德国程序猿Michiel Mulders近日就精心炮制了一份机器学习入门新手指南。一起来看看AI大法该当如何修炼吧。

入门指南

欲练此功,首先要知道,纸上谈兵是本门大忌。

吴恩达就曾经说到,想要入门机器学习,应该进行一些项目实践。

所以入门第一步,从选择一个数据集开始:

  • 找到一个大小合宜,并且相对容易分析的数据集。 UCL ML RepositoryKaggle 盛产此物。
  • 对数据集进行试验。挑几个顶级的机器学习算法跑一跑这些数据,看看数据的表现,了解一下每种算法的性能。
  • 挑选表现最佳的算法,调教它。

这就完事了?no,no,no,本份指南还贴心奉上五佳项目,任君挑选。

↓↓↓↓↓↓

TOP 5

项目:监督式机器学习

数据集:鸢尾花数据集

鸢尾花数据集堪称机器学习领域的“Hello World”。对数据一无所知?那么选择它就对了。

这个数据集的好处是足够小,仅仅只有150行,并且它只有四个属性:花瓣长度,花瓣宽度,萼片长度和萼片宽度。

通过判别四个已知属性,四种不同类型的鸢尾花在数据集中被标记出来,所以你可以拿它来学学监督式机器学习。

这里建议使用多元分类训练方法。

另外,记得给自己设立一个小目标:根据花瓣和萼片的大小对三种花进行分类。

相关链接:

UCI机器学习仓库(UCI ML Repository):

https://archive.ics.uci.edu/ml/index.php

Kaggle数据集:

https://www.kaggle.com/datasets项目:交易预测平台:GNY

很多流行的机器学习服务价格高昂,对于新手十分不友好。不如选择GNY团队的机器学习平台,这个平台挺好挺强大,最重要的是提供免费的下载安装。

GNY团队还发布了一个通过神经网络预测零售交易的demo,正式版本将在今夏登陆,还将提供定制服务。

对于机器学习新人小白来说,这个demo不失为一个有趣的入门项目。你可以到MLWave上找一个数据集,根据消费历史来预测哪些人会成为回头客。

相关链接:

GNY机器学习平台:

https://www.gny.io/

MLWave回头客数据集:

https://mlwave.com/predicting-repeat-buyers-vowpal-wabbit/

项目:情绪分析

数据集:twitter

情绪分析是机器学习里非常有趣的一种应用,检索数据也很容易获得,Reddit、Facebook和Linkedln都提供了易于使用的API。不过首选还是Twitter的数据,Twitter平台上的数据格式一致,预处理也要容易得多。

首先 !pip install Python -twitter ,然后就开动吧,不过过度使用可是会被列入黑名单的哟。

再列几个具体的方向以供参考:

  • 分析对新发布电影的情绪,并将其与IMDB和其他评级网站上的评论进行比较。
  • 分析围绕特定选举或任何其他政治话题的情绪。
  • 根据推文的情绪预测前50种加密货币未来的价格。

相关链接:

Twitter数据集:

https://github.com/shaypal5/awesome-twitter-data

项目:推荐系统

数据集:Movielens

想必没有人会对推荐系统感到陌生。

推荐系统是机器学习技术在商业中最成功和最广泛的应用之一,几乎渗入到了日常生活的每一个角落。网易云音乐的个性推荐,神奇的抖音算法都属于这一范畴。

关于推荐系统,可以使用两种算法:

  • 基于内容推荐算法:寻找内容的相似性。
  • 协作过滤算法:寻找交互中的相似性。即对一大群人进行分析,确认品位相近的人。

Movielens是最受欢迎的电影评级数据集之一,对初学者来说是试验推荐算法的理想数据集。

于是你可以再立一个小目标了:根据用户评分来预测他们会喜欢哪部电影。

项目:股票价格预测

数据集:Quandl

对于股民来说,如果能预测股票价格,那岂不是亦可赛艇?

但不管你是不是股民,都可以试试用机器学习来实现股票价格预测。

我们先来列列关键字:

  • 波动率指数
  • 历史价格
  • 全球宏观经济指标
  • 基本面分析
  • 指标技术分析

股票市场具有更短的反馈周期,也就是预测的结果可以更快被验证,十分适合新手学习。

选择一个简单的机器学习示例,到Quandl.com上下载股票市场数据集,就可以动手预测未来6个月的股票价格变化了。友情提醒: AI只负责产生结果,不对结果负责

相关链接:

Quandl数据集:

https://www.quandl.com/

新手向TOP 5项目介绍完毕。看到这里,是不是已经摩拳擦掌,感觉自己可以分分钟入门AI啦?快拎上数据集,AI江湖等你亮剑~

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
本期特别推荐| 机器入门经典项目
在机器学习领域有什么好的项目可以实操吗?有哪些经典小项目可以推荐学习呢?以下的项目将帮助你更好了解机器学习,步入AI领域的大门!
叶锦鲤
2023/03/21
5010
本期特别推荐| 机器入门经典项目
2020年度最佳的23个的机器学习项目(附源代码)
我们都知道,教科书上所学与实际操作还是有出入的,那关于机器学习有什么好的项目可以实操吗?
大数据文摘
2020/08/02
2.4K0
机器学习(二)什么是机器学习
(基本认识)机器学习专门研究计算机怎样模拟或实现人类的学习行为,使之不断改善自身性能。是一门能够发掘数据价值的算法和应用,它是计算机科学中最激动人心的领域。我们生活在一个数据资源非常丰富的年代,通过机器学习中的自学习算法,可以将这些数据转换为知识。
Maynor
2023/10/17
3580
机器学习(二)什么是机器学习
AI应用实战课学习总结(2)hello sk-learn
今天是我们的第2站,了解下scikit-learn框架(简称sk-learn)及相关的常用可视化库,一起和机器学习说声“Hello World”!
郑子铭
2025/02/18
890
AI应用实战课学习总结(2)hello sk-learn
鸢尾花(Iris)数据集入门
鸢尾花(Iris)数据集是机器学习领域中最经典的数据集之一。它由三种不同品种的鸢尾花的测量数据组成:山鸢尾(setosa)、变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica)。 在这篇文章中,我们将使用Markdown代码格式详细介绍鸢尾花数据集的基本信息以及如何加载和探索这个数据集。
大盘鸡拌面
2023/10/20
3K0
机器学习-逻辑回归:从技术原理到案例实战
逻辑回归(Logistic Regression)是一种广泛应用于分类问题的监督学习算法。尽管名字中含有“回归”二字,但这并不意味着它用于解决回归问题。相反,逻辑回归专注于解决二元或多元分类问题,如邮件是垃圾邮件还是非垃圾邮件,一个交易是欺诈还是合法等。
TechLead
2023/10/30
1.9K0
机器学习-逻辑回归:从技术原理到案例实战
Python机器学习:适合新手的8个项目
教科书和课程会让你误以为精通,因为材料就在你面前。但当你尝试去应用它时,可能会发现它比看起来更难。而「项目」可帮助你快速提高应用的 ML 技能,同时让你有机会探索有趣的主题。
猴子数据分析
2022/07/13
1.1K0
Python机器学习:适合新手的8个项目
R语言k-means聚类、层次聚类、主成分(PCA)降维及可视化分析鸢尾花iris数据集
(a)部分:k-means聚类 使用k-means聚类法将数据集聚成2组。  画一个图来显示聚类的情况 使用k-means聚类法将数据集聚成3组。 画一个图来显示聚类的情况 (b)部分:层次聚类 使用全连接法对观察值进行聚类。 使用平均和单连接对观测值进行聚类。 绘制上述聚类方法的树状图。
拓端
2021/06/29
4K0
用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么?
今天李世石已连续输掉了第二局,粗看下来,后面几盘似乎已没啥悬念了。无疑,这是一个伟大的时刻,也是个伟大的开始,超级智能机器在未来将会在人类生活中扮演更多更重要的角色。 资本市场,越来越多的量化策略与量化交易,越来越多的机器在介入,以前散户面对的是同样赤手空拳的空头,但现在我们面对的是高度智能的机器以及加杠杆的赌徒,以前跌一年,现在一周搞定,信息传播越来越快,人心预期转化也特别迅速,于我们,更需要理性,纪律与底线。 Alpha Go的优势: 无比强大的数据分析能力。对于公司的财务、行业的数据,未来的趋势,依据
机器学习AI算法工程
2018/03/13
1.1K0
用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么?
适合入门的8个趣味机器学习项目
谈到机器学习,相信很多除学者都是通过斯坦福大学吴恩达老师的公开课《Machine Learning》开始具体的接触机器学习这个领域,但是学完之后又不知道自己的掌握情况,缺少一些实际的项目操作。对于机器学习的相关竞赛挑战,有些项目的门槛有些高,参加后难以具体的实现,因此造成自己对机器学习的热情逐渐衰减。大部分都经历过这个过程,一直想找一些练手的项目,最典型的练手项目比如手写体识别等,但这类的项目成熟得不能再成熟了,参考别人的网络模型跑一下实验,结果的准确率都快达到100%,学习调参的机会比较少,因此都想找一些
小莹莹
2018/04/18
1.3K0
适合入门的8个趣味机器学习项目
鸢尾花经典机器学习分类Python实现案例
由Fisher在1936年整理的Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。
机器思维研究院
2020/01/02
5.3K0
8个带你快速入门的趣味机器学习项目(附数据源、教程)
来源:机械鸡(ID:jixieji2017) 本文长度为3216字,建议阅读6分钟 本文为你介绍八个短时间可以完成的趣味机器学习项目。 抽时间做项目是最好的一种投资方式,在项目中你会享受学习、保持积极性并能获得更快的进展。没有任何理论可以代替实践,虽然教材和课程能让你掌握一些基本原理,但在尝试应用时,你会发现具体操作起来比较困难。 因此项目有助于提高应用机器学习的技巧,此外在找工作中也会给自己增添一些筹码。 以下将具体介绍这八个项目,每个项目都能在一个周末完成,如果你喜欢的话,可以对其进行相关的扩展。
数据派THU
2018/01/30
1.5K0
8个带你快速入门的趣味机器学习项目(附数据源、教程)
神经网络分类算法的应用及其实现
我们知道,深度学习的本质就是神经网络算法(深度学习是神经网络算法的一个分支)。理论上来说,在数据量和隐藏层足够多的情况下,神经网络算法能够拟合任何方程(函数)。神经网络算法是一种具有网络结构的算法模型,这决定了它具有非常好的延展性,通过调节神经网络中各个节点的权值参数使得分类效果明显提升。总的来说,神经网络算法具有以下特点:
zhangjiqun
2024/12/14
2350
神经网络分类算法的应用及其实现
机器学习实战第1天:鸢尾花分类任务
鸢尾花分类任务是一个经典的机器学习问题,通常用于演示和测试分类算法的性能。该任务的目标是根据鸢尾花的特征将其分为三个不同的品种,即山鸢尾(Setosa)、变色鸢尾(Versicolor)和维吉尼亚鸢尾(Virginica)。这个任务是一个多类别分类问题,其中每个样本都属于三个可能的类别之一。
Nowl
2024/01/18
2.1K0
机器学习实战第1天:鸢尾花分类任务
机器学习经典开源数据集
"数据为王,使用相同机器学习算法,不同质量的数据能训练出不同效果的模型。本文将分享数据科学领域中经典的几个开源数据集。
木东居士
2018/05/25
2.5K8
Python中的sklearn入门
scikit-learn(简称sklearn)是一个广泛使用的Python机器学习库,它提供了丰富的功能和工具,用于数据挖掘和数据分析。它构建在NumPy,SciPy和matplotlib等科学计算库的基础上,使得使用者可以轻松地进行机器学习模型的构建、训练和评估等工作。 本文将介绍sklearn库的基本概念和常用功能,并利用示例代码演示如何使用sklearn进行机器学习模型的训练和评估。
大盘鸡拌面
2023/10/18
5210
17个真实项目带你入门机器学习!CloudStudio让你边学边练,算力开盒即用!
CloudStudio 重磅推出 《机器学习项目实战》 课程,通过17个真实世界的数据科学项目,带你从零开始掌握机器学习的核心技能!
CloudStudio
2025/08/09
1010
17个真实项目带你入门机器学习!CloudStudio让你边学边练,算力开盒即用!
决策树DTC数据分析及鸢尾数据集分析
豌豆贴心提醒,本文阅读时间7分钟 今天主要讲述的内容是关于决策树的知识,主要包括以下内容: 1.分类及决策树算法介绍 2.鸢尾花卉数据集介绍 3.决策树实现鸢尾数据集分析 希望这篇文章对你有所帮助,尤其是刚刚接触数据挖掘以及大数据的同学,同时准备尝试以案例为主的方式进行讲解。如果文章中存在不足或错误的地方,还请海涵~ 一. 分类及决策树介绍 1.分类 分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封
小小科
2018/05/02
1.9K0
决策树DTC数据分析及鸢尾数据集分析
最强数据集集合:50个最佳机器学习公共数据集丨资源
外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,量子位为大家分享一下~
量子位
2018/12/07
35.4K1
机器学习第2天:训练数据的获取与处理
我们知道机器学习的关键是数据和算法,提到数据,我们必须要有在这个大数据时代挑选我们需要的,优质的数据来训练我们的模型,这里分享几个数据获取平台
Nowl
2024/01/18
2740
机器学习第2天:训练数据的获取与处理
推荐阅读
相关推荐
本期特别推荐| 机器入门经典项目
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档