前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何入门数据分析?

如何入门数据分析?

作者头像
数据社
修改2020-05-26 10:25:51
8530
修改2020-05-26 10:25:51
举报
文章被收录于专栏:数据社
如今,大多数公司都

如果你刚开始学习数据分析,那么怎么入门呢?其实各大招聘网站的数据分析职位就是一个很好的参考。那么数据分析师究竟需要哪些技能呢?

数据分析必备技能:

  • Excel
  • SQL
  • Python或者R
  • 数据可视化
  • 机器学习
  • PPT
  • 逻辑思维

下面我们一个个看下

一、Excel

说到Excel,首先想到的可能是电子表格,但是这个工具背后有更多的分析能力,如编写宏和使用VBA查找,这样的高级Excel方法在处理小数据量时更轻松、快速的分析。比如散点图可以很方便的帮助我们发现数据分布特征,Excel甚至可以做线性回归。因为Excel受数据量的影响,所以学习一门数据处理语言是非常有必要的。

二、SQL

SQL是普遍存在的行业标准数据库语言,是数据分析师需要掌握的最重要的技能。这种语言通常被认为是Excel的“终极”版本,它能够处理Excel无法处理的大型数据集。

几乎每个数据分析组织都至少需要一个了解sql的人,更需要一个数据仓库团队。以前很多行业的业务逻辑全写在数据库存储过程中,那时候,只会写SQL就可以拿高薪。现在很多大数据计算引擎也都支持了SQL操作,所以你想使用大数据,那么学习SQL是第一步。

三、Python或者R

任何Excel能做的事情,R或Python都能做得更好,甚至要快10倍。和SQL一样,R和Python可以处理Excel不能处理大数据量的事情。它们是强大的统计编程语言,用于对大数据集执行高级分析和预测分析。要成为一名真正的数据分析师,您需要超越SQL并至少掌握其中一种语言。

那么你应该学习哪一个呢?R和Python都是开源和免费的,公司招聘一般也是写明,会其中一个就可以。但是,由于Python现在有很多工具包,而且机器学习和深度学习也都和Python联系紧密,所以推荐大家优先学习Python。

四、数据可视化

为什么要掌握可视化,举个例子。

你在买水果的时候肯定关系水果是不是坏的,你一看就知道,数据也一样,你可以通过可视化很快的发现异常数据、脏数据。

同样,厨师们除了要保证菜好吃,还要把菜做的好看,这样客人们才会更加满意,原因买单。数据分析的内容再好,最后都要可视化出来,让老板能看懂,这样才能升值加薪啊!

可见,可视化能够用数据讲述一个引人注目的故事,让你的观点更易被人理解。分析师使用吸引眼球的、高质量的图表和图形,以清晰简洁的方式展示分析的发现。所以,去学习Python的Matplotlib和Seaborn吧,可以参考之前的文章讲解《数据挖掘从入门到放弃(五)seaborn 的数据可视化》。

五、机器学习

现在AI和预测分析是数据科学领域最热门的两个主题,数据分析师不只是单单对历史数据的统计操作了,对机器学习的理解已被确定为分析师的工作之一。虽然并不是每个分析师都使用机器学习,但是为了在这个领域要走的更远,学习机器学习是很重要的。然而机器学习需要一定的统计学知识,需要理解算法的原理,然后才能更好的使用。可以参考文章结尾的历史文章精选。

六、PPT

数据可视化和PPT是相辅相成的。但是我们每个人基本都是程序员出身,不屑于写PPT。但是你不能拿着代码给老板汇报吧。PPT可以很好帮助你表达清楚自己的分析思路和分析结论,也帮让老板理解。但是PPT并不是直接把word粘贴过来,PPT最主要的是图,字不用太多,因为PPT是用来讲解的,不是需求文档!

关于PPT,还是要多谢,写的多了,被老板批评的多了,自然就会了……

七、逻辑思维能力

使用数据来找到问题的答案,意味着首先你要弄清楚要什么,也就是用户故事要想好。数据分析师的角色是发现并关联那些并不总是很清晰的联系。这个比以上6条都难,我遇到过有些分析师用机器学习或者深度学习跑出一些结果,最后告诉老板,结果是模型学习的,是不可解释的。我承认,比如神经网络跑出来的结果,很难解释。但是我们是数据分析师,不是算法工程师,我们首先要考虑的就是分析结果和我们之前的用户故事有什么联系,我们要找到这部分联系,解释给老板。那么如何来培养这种能力呢?比如问自己最初的用户故事是什么,怎么来的,联系当前的业务知识,看看结果和分析需求的哪个节点能联系起来,是否能够使用起初的用户故事。经常这样思考,可以帮助你在寻找解决方案时保持清醒,而不是被一个很难解释搞蒙。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据分析必备技能:
    • 一、Excel
      • 二、SQL
        • 三、Python或者R
          • 四、数据可视化
            • 五、机器学习
              • 六、PPT
                • 七、逻辑思维能力
                相关产品与服务
                云数据库 Redis®
                腾讯云数据库 Redis®(TencentDB for Redis®)是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档