这篇文章是我对大三笔记的整理转载,之后在课本的不断复习过程中会不断把知识整理更新上来。
(其中有好多知识因为不是很重要,老师没细讲,所以还没深入剖析,会在之后对这些文章中的知识点不断剖析完善的,一般下面有"更新中......."则表示本章知识还未剖析完善........见谅)
更新中.......
数据ETL是用来实现异构数据源的数据集成,即完成数据的抓取/抽取(Capture/Extract)、清洗(Scrub or data cleansing)、转换(Transform)、装载与索引(Load and Index)等数据调和工作
MBA(market basket analysis) 啤酒与尿布的故事 在数据分析行业,购物篮的商品相关性分析被称为“数据挖掘算法之王”
聚类分析建模原理:内部距离最小化和外部距离最大化
偏差检测示意