统计分析一般都是验证性分析
数据分析中,不管是数据挖掘领域还是统计分析领域,都较为侧重验证性,验证性分析占据非常重要的主导地位。不同的是,99%的统计分析都是验证性分析,而数据挖掘领域中验证性分析的比例略低,能达到80%-90%左右。
实际业务中用什么去主导分析?
实际工作中,当面临一个庞大的数据库时,用什么方法去主导自己的分析呢?如果仅仅针对业务痛点进行分析,这样的思路没错,但是很快会发现,这样会导致整个分析进入死胡同,并且一段时间后,大部分的数据分析工作都在做重复的分析内容,因此对商业的支撑便会出问题。此时需要反思数据分析是否有框架的指导,如果有框架的指导,还需要结合4P理论、4C理论以及客户关系理论等。
如果不了解验证分析背后框架或理论,则可以参考同行业中的相似框架。
数据挖掘不强调精度
不同的数据分析领域量化的方式不同,传统分析中更为关注精确性,如果指标做不到精确,则业务人员会对模型的分析结果产生质疑,尤其是问卷行业,对精度的要求更高。
然而,数据挖掘领域,精度似乎没有那么重要,我更加关注指标的可解释性以及模型与业务之间的契合性。
不同场景下数据挖掘的含义不同
计算机模型、统计模型与数据挖掘模型处理问题的出发点完全不同,例如什么是大数据这个问题,不同场景下的含义是不同的:
因此,提到大数据时首先要清楚场景,否则很难将数据精确度、数据以及商业价值更好的契合起来。
数据挖掘不太关心因果
通常,统计分析侧重于模型的因果,然而,商业价值中,因果关系并不是那么重要,探究结果只会带来成本的上升,因此数据挖掘模型不太关注因果,数据挖掘领域更为关注成本与收益。
本文分享自 Data Analyst 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!