关于作者:林夕是四川电子科技大学的研究生,主要研究方向是数据分析,机器学习。
一,什么是SKlearn
SciKit learn的简称是SKlearn,是一个python库,专门用于机器学习的模块。
以下是它的官方网站,文档等资源都可以在里面找到http://scikit-learn.org/stable/#。SKlearn包含的机器学习方式:
分类,回归,无监督,数据降维,数据预处理等等,包含了常见的大部分机器学习方法。
关于SKlearn的安装,网上教程很多,再次不赘述。建议使用Anaconda,可以方便的安装各种库。Anaconda教程:http://python.jobbole.com/87522/
SKlearn给出了如何选择正确的方法:
官网清晰图:http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
图表对于什么样的问题,采用什么样的方法给出了清晰的描述,包括数据量不同的区分。
二,SKlearn的强大数据库
数据库网址:http://scikit-learn.org/stable/modules/classes.html#module-sklearn.datasets
里面包含了很多数据,可以直接拿来使用。
例如:
1.鸢尾花数据集
打开里面的鸢尾花数据集,我们可以看到页面上同样有调用示例:
2.波士顿房价数据集
而且在SKlearn官网,对于每一个数据集,在后面都给出了,使用该数据集的示例,例如Boston房价数据集:
三,通用学习模式
SKlearn中学习模式的调用,有很强的统一性,很多都是类似的,学会一个,其他基本差不多。
1.鸢尾花数据集
针对上述已经导入的鸢尾花数据集,继续对其进行分析。
2.波士顿房价数据集
这里,我们调用房价数据集,然后使用线性回归的方法对其进行预测
以上众多内容,参照莫烦教程
更详细的内容可以去他官网查看。https://morvanzhou.github.io/
领取专属 10元无门槛券
私享最新 技术干货