前言
随着数据时代的蓬勃发展,越来越多的企事业单位开始认识到数据的重要性,并通过各种手段进行数据的搜集,然后基于数据分析和挖掘的手段实现数据的变现,而Python就是最常用的分析或挖掘工具之一。
写书背景
为满足用人单位对数据分析和挖掘人员在编程方面的技能要求,《从零开始学Python数据分析与挖掘》一书将遵循由浅入深的原则,详细介绍如何利用Python及其模块实现数据分析和挖掘的实用技能。
本书简介
结合Python中成熟的Numpy、Pandas、MatPlotLib、Seaborn、Statsmodels、SciPy、和Sklearn等模块,实现数据分析与挖掘中关于数据的清洗、整理、探索、可视化、建模和评估等流程的操作,让每一位对数据分析或挖掘的从业者或感兴趣的读者都能从中学到所需的内容。
本书包含十大常用数据挖掘算法及实战案例,如多元线性回归的预测模型、决策树分类模型、SVM分类模型、GBDT分类模型、K均值聚类模型等,基本覆盖用人单位对常用挖掘算法的需求。
本书大纲
第一章,数据分析与挖掘概览
第二章,从收入的预测分析开始
第三章,Python入门基础
第四章,Python数值计算工具--Numpy
第五章,Python数据处理工具--Pandas
第六章,Python数据可视化--Matplotlib
第七章,基于线性回归模型的预测
第八章,岭回归与LASSO回归模型的比较和应用
第九章,基于Logistic回归模型的分类
第十章,决策树与随机森林的比较和应用
第十一章,基于KNN模型的预测和分类
第十二章,三类朴素贝叶斯模型的比较和应用
第十三章,SVM模型的应用
第十四章,提升树之GBDT模型的应用与发展
第十五章,Kmeans聚类分析的应用
第十六章,DBSCAN与层次聚类的比较和应用
本书特色
专业的讲解
丰富的实例
精彩的图文
开放的源代码
答谢
为感谢粉丝朋友对我新书的支持,特组织本次送书活动,将对三位幸运儿送出书本。活动的具体规则和赠送方式如下:
数据分析1480
学习与分享,取长补短,关注小号!
领取专属 10元无门槛券
私享最新 技术干货