前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据挖掘更在乎成本与收益

数据挖掘更在乎成本与收益

作者头像
许卉
发布2019-07-15 17:26:05
5190
发布2019-07-15 17:26:05
举报
文章被收录于专栏:Data Analyst

统计分析一般都是验证性分析

数据分析中,不管是数据挖掘领域还是统计分析领域,都较为侧重验证性,验证性分析占据非常重要的主导地位。不同的是,99%的统计分析都是验证性分析,而数据挖掘领域中验证性分析的比例略低,能达到80%-90%左右。

实际业务中用什么去主导分析?

实际工作中,当面临一个庞大的数据库时,用什么方法去主导自己的分析呢?如果仅仅针对业务痛点进行分析,这样的思路没错,但是很快会发现,这样会导致整个分析进入死胡同,并且一段时间后,大部分的数据分析工作都在做重复的分析内容,因此对商业的支撑便会出问题。此时需要反思数据分析是否有框架的指导,如果有框架的指导,还需要结合4P理论、4C理论以及客户关系理论等。

如果不了解验证分析背后框架或理论,则可以参考同行业中的相似框架。

数据挖掘不强调精度

不同的数据分析领域量化的方式不同传统分析中更为关注精确性,如果指标做不到精确,则业务人员会对模型的分析结果产生质疑,尤其是问卷行业,对精度的要求更高

然而,数据挖掘领域,精度似乎没有那么重要,我更加关注指标的可解释性以及模型与业务之间的契合性

不同场景下数据挖掘的含义不同

计算机模型、统计模型与数据挖掘模型处理问题的出发点完全不同,例如什么是大数据这个问题,不同场景下的含义是不同的:

  • 实验室场景中,由于场景样本量较小,样本获取不易,因此对数据精确度要求较高,30个左右样本量即为大数据。;
  • 市场分析中,样本量200左右即为大数据;
  • 数据挖掘领域中,通常以100万为界进行大数据的区分。

因此,提到大数据时首先要清楚场景,否则很难将数据精确度、数据以及商业价值更好的契合起来。

数据挖掘不太关心因果

通常,统计分析侧重于模型的因果,然而,商业价值中,因果关系并不是那么重要,探究结果只会带来成本的上升,因此数据挖掘模型不太关注因果,数据挖掘领域更为关注成本与收益

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-04-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Data Analyst 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档