课程概述
Toby,持牌照金融公司担任模型验证专家,国内最大医药数据中心数据挖掘部门负责人!此课程讲述如何运用python的sklearn快速建立机器学习模型。课程结合美国威斯康辛乳腺癌细胞临床数据,实操演练,建立癌细胞预测分类器。
课程讲述十大经典机器学习算法:逻辑回归,支持向量,KNN,神经网络,随机森林,xgboost,lightGBM,catboost。这些算法模型可以应用于各个领域数据。
课程耗费三年时间,360度无死角的讲述整个模型开发周期,非市场上快餐教学。教程包括数据获取,数据预处理,变量筛选,模型筛选,模型评估,模型调参。
本视频系列通俗易懂,课程针对学生和科研机构,python爱好者。本视频教程系列有完整python代码,观众看后可以下载实际操作。这些模型代码可为中小型企业提供解决方案。
目录
章节1:癌症常识
课时1警钟长鸣!癌症就在你身边11:00
课时2癌症科普介绍23:05
课时3病毒细菌诱发的癌症20:43
课时4祸从口入-致癌食物大揭秘08:37
课时5Python机器学习挖掘癌细胞概述13:11
章节2:sklearn编程环境搭建
课时6Python非官方扩展包下载地址02:21
课时7python第三方包安装(pip和conda install) 02:48
课时8Anaconda下载安装07:02
课时9Canopy下载和安装03:47
章节3:sklearn机器学习基础知识
课时10机器学习数据库介绍02:19
课时11机器学习书籍推荐02:59
课时12Python数据科学常用的包13:14
课时13如何选择模型03:57
课时14sklearn算法速查表02:29
课时15sklearn建模基础代码18:19
课时16python数据科学入门介绍(选修)55:15
章节4:获取乳腺癌临床数据
课时17数据获取-乳腺癌细胞临床数据07:06
章节5:变量筛选和描述性统计
课时18因子分析-解释癌细胞特征33:24
课时19变量筛选1-模型法11:50
课时20变量筛选2-比例法percentile07:04
课时21变量筛选3-方差法(推荐)06:36
课时22变量筛选4-KBest01:59
章节6:十大经典机器学习算法-建立乳腺癌细胞分类器
课时23逻辑回归logistic regression27:17
课时24支持向量SVM13:48
课时25KNN最近邻算法13:38
课时26决策树-decision tree21:59
课时27随机森林-random forest14:02
课时28神经网络neural network17:07
课时29xgboost12:27
课时30lightGBM03:51
课时31catboost07:08
课时32算法优劣对比10:52
课时33bagging VS boosting05:51
章节7:数据预处理
课时34pandasl数据处理基础知识15:50
课时35哑变量处理-hotcode热编码06:14
课时36imputer-缺失数据处理04:49
课时37scale-数据标准化处理12:13
章节8:模型调参
课时38遍历调参法05:15
课时39网格调参106:10
课时40网格调参204:26
课时41随机网格调参02:29
章节9:模型验证
课时42交叉验证cross validation03:45
课时43模型验证前言12:15
课时44混淆矩阵14:16
课时45ROC曲线11:57
课时46PSI(population stability index)10:20
课时47基尼系数GINI index25:16
课时48KS(kolmogorov-smirnoff)06:51
章节10:附录
课时49视频教程python脚本下载网址需购买观看
课时50显微镜下癌细胞
领取专属 10元无门槛券
私享最新 技术干货