读书交流│8期 《用数据讲故事》 用故事驱动决策 data analysis ●●●● 分享人:瓜瓜 大家好,这里是小飞象·数据领地·读书会第8期完结直播总结分享,本次直播的目的有两个,一是我们第8期读书会的总结,给大家梳理一下《数据分析原理》这本书的精华内容,二是为我们,参加这次读书会,并完成全部任务打卡的小伙伴们,进行结业颁奖。分享时间大概在一小时左右,大家要坚持听到最后哦。(可以在公众号留言交流,读书会往期回顾) (瓜瓜个人公众号) 做一个对世界充满好奇的人!数据分析的目的是明确问题,探索数据价值、形成业务落地建议,其表现形式往往是具有故事性的、可视化的,逻辑大概会是:“我做了一个怎样的假设……然后为此准备了哪些数据……在数据探索中使用了什么方法……根据数据发现的关联或趋势如何……下一步建议如何行动”。这种探索性分析是具有前后的故事脉络和情节的。可见,用故事思维做可视化的数据分析,会让我们的沟通更加高效、更直接 。 但是,遇到具体问题时,常常觉得无从下手。如: ▶如何选择合适的图表展示形式? ▶如何消除杂乱,如何聚焦受众的视线? ▶如何用数据讲故事? ······· 所以本期,小飞象·数据领地·读书会的直播总结,就来跟大家一起来品读《用数据讲故事》:用故事驱动决策,本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。 在这过程中,建议全程认真听,带着思考来听(去看),有任何问题都可以随时交流哦! —▼—
本书共有10个章节,可以划分为三个部分,第一部分是(1-7章)描述了“用数据讲故事”的方法论,第二部分是(8-9章)用图表案例举例。第三部分是(第10章)一些补充和思考。主要内容是第一部分;“如何用数据讲好故事”。将数据转化为信息并驱动作出更好的决策,关键就在于将它们可视化并用它们讲故事。
由于缺乏先天技能和后天训练,我们往往最终依赖工具来处理和理解数据。而默认工具和一般实践常常令数据和讲述的故事枯燥无味。
本书讲述的内容能够让我们从简单地展示数据成长到用数据讲故事。
我们将从6个方面学会用数据讲故事
—▼—
▼ 谁是你的受众?你需要他们了解什么或者做什么? 先了解两个分析概念:探索性分析和解释性分析。 探索性分析:指理解数据并找出其中值得关注或分享给他人的精华(在100牡蛎中找到2颗珍珠)。 解释性分析:将数据抽象为受众能够消化的信息(2颗珍珠)。 本书主要是以解释性分析为主进行数据可视化! 对象、内容和方式
案例 情景: 想象你是小学四年级的科学教师,刚刚圆满完成了一个暑期科学试点项目,该项目旨在让孩子们接触到小众的科学主题。你用问卷来了解孩子们对于科学的感受在项目前后的变化,调查结果让你坚信项目大获成功,并愿意继续举办这样的暑期科学项目。 三要素: ❑对象:可以批准资金使暑期科学项目得以继续的预算委员会。 ❑内容:暑期科学项目是成功的,申请X美元用于继续开展项目。 ❑方式:用项目前后的问卷数据展示项目是成功的。 —▼—
▼ 常用于数据沟通的图表类型,讨论每种图表类型的合适的用例,并通过现实示例进行阐释。 数据可视化的图表各式各样、种类繁多,但只要掌握其中的一小部分就能满足绝大多数需求。
当你只有一两项数据需要分享时,简单文本是绝佳的沟通方法。考虑只用数字(尽可能突出)和一些辅助性文字来清晰地阐述观点。
由于数据标签在条形图的外面,甚至会扭曲你的认知,让你感觉从视觉上并不能看出20%的数据条高度不及41%的一半 在本例中,数据的实际大小(20%和41%)有助于解读和理解发生的变化。
表格最适合的场景是,与一群受众沟通,他们会寻找各自特定的兴趣点。如果你需要展示不同的计量单位,用表格通常也会比图形更简单。 使用表格时需要记住的一点是,让设计融入背景,让数据占据核心地位。不要让厚重的边框和阴影与数据争夺受众的注意力。相反,要使用窄边框或者空白来区分表格的元素。
·热力图 热力图是用表格的形式可视化数据的一种方法,在显示数据的地方(在数据之外)利用着色的单元格传递数据相对大小的信息。
散点图在展示两件事的关系时很有用,因为可以同时将数据对应到x轴和y轴上,观察是否存在某种关系以及存在何种关系。
线图最常用于绘制连续的数据。因为线连接了点,这就暗示了点与点之间存在着离散数据(一系列数据分隔成不同的类别)间没有的联系。通常,连续性数据都以时间为单位:天、月、季度和年度。 ·折线图
在某些情况下,折线图中的线可能代表一个综合的统计数据,比如平均值或者预测的点估计。如果你还想展现范围(或者置信区间,视具体情况而定),可以直接在图上进行可视化。
·斜率图 斜率图适用于两个时间段或者两组对比数据点,可以快速地展示两组数据之间各维度的相对提升、降低等差异。
条形图易于阅读,我们用眼睛比较条形图的末端,很容易快速得出结论:哪一类最大、哪一类最小以及类别之间的增减区别。
·堆叠条形图 比较各类别之间总体区别的同时还能看出每个类别中子成分的占比情况
·瀑布图 瀑布图可用于抽离出堆叠条形图中的一部分进行重点关注,或者展示起点和结果以及其中的上升下降等变化。
人眼不擅于在二维空间进行定量的度量,这使得面积图比我们讨论过的其他图表类型更难阅读。因此通常避免使用面积图,只有一个例外——当需要可视化相差极大的数值时。方形带有第二个维度(同时有长和宽,而条形图只有长或者宽),因而能比单一维度更紧凑地进行可视化。
还有很多图形和元素你应该避免使用:饼图、甜甜圈图、3D图形、双y轴等等 —▼—
视觉感知的格式塔原则,以及如何将其应用到表格或是图形这类信息的展示上。
每当接收信息时,我们就会感受到认知负荷。可以认为认知负荷是学习新知识所需的脑力。
谈到视觉沟通,最重要的在于受众感知的认知负荷:他们认为需要付出多少精力才能提取出信息。他们并不会通过深思熟虑地做这个决定,但这会影响你的信息能否成功传达。
造成过度或者无关的认知负荷的一个元凶就是我所提到的杂乱。至于如何识别图形中的信号(希望沟通的信息)和噪声(杂乱),不妨使用视觉认知的格式塔原则。
六大原则:临近原则、相似原则、包围原则、闭合原则、连续原则和连接原则。
我们倾向于认为物理上临近的物体属于同一个群体。
拥有相似颜色、形状、大小或者方向的物体会被视作相关或从属于一个群体。
我们会认为物理上包围在一起的物体从属于同一个群体。
闭合的概念是指人们希望事情能够简化并符合脑海中已经存在的结构。
连续原则与闭合原则类似:当我们观察物体时,尽管没有显式的路径,但我们的眼睛倾向于寻找最平稳的路径并自然地创造出连续性。
我们倾向于将物理连接的物体视作一个群体。
在没有其他视觉上的提示时,受众通常会从页面或者屏幕的左上方开始,按“之”字形(或者多个“之”字形,取决于布局)移动视线并消化信息。因此,当涉及表格和图形时,我偏爱将文字(标题、坐标轴标签、图例等)按左上角对齐。这意味着受众会先看到有关如何阅读图表的细节,然后再看到数据本身。
有策略地使用留白也会为你的视觉沟通带来同样强大的效果:边界处避免出现文字和图表。抵制住想要拉伸图表撑满可用空间的欲望,根据内容多少决定图表的合适大小。
清晰的对比对受众来说是一种信号,帮助他们理解应该把注意力集中到哪里。
场景:想象你现在管理着一个IT团队。你的团队从职员处接受工单或者技术问题。去年,你已经开除了一些人,并且决定不进行新的招聘。你听说剩下的职员在抱怨不得不“收拾残局”。你被问到来年的招聘需求,也正在思考是否要多招一些人。首先,你想要了解去年解雇那些人对团队整体生产力的影响。你绘制了月度的新增工单以及去年处理工单的趋势,发现有证据表明人力不足的确导致了团队生产力的下降,现在你想将你绘制的粗糙图表改造成招聘需求的基础。
步骤
—▼—
如何有策略地通过前注意属性引导受众注意你期望的地方,并建立图形化的层级帮助引导受众按你期望的顺序处理信息。
如果有策略地使用前注意属性,就能够让受众不知不觉地看到我们期望展现的内容。
常见的前注意属性-引导线
前注意属性在两方面非常有用:快速引导受众的注意力到你希望的地方,建立信息的视觉层次。
前注意属性策略 | 效果 |
---|---|
原图 | |
利用颜色吸引注意 | |
建立信息的视觉层次 |
大小很重要。相对大小代表了相对重要性。在视觉沟通的设计中,时刻记住这一点。如果你需要展示几件重要性相同的事情,请使用相似的大小。相反,如果有一件事情尤其重要,那么用大小来体现这一点:将它变大!
在少量使用时,颜色是吸引受众注意的最强大的工具之一。请克制住为了丰富多彩而使用颜色的冲动。相反,有选择、有策略地使用颜色这一工具突出图表中的重要部分。颜色的使用应该永远是特意作出的决定,千万别让工具为你作出这个重要的决定。
如果没有其他视觉线索,大多数受众会从图表或者幻灯片的左上角开始,按“之”字形扫视屏幕或者页面。他们会最先看到页面的顶端,这使得这里成为了风水宝地。
—▼—
传统的设计概念如何应用在数据沟通上,从不同的视角探讨可供性、无障碍、美观和接受度。
在设计领域,专家会谈到物体的“可供性”。它们是设计的固有属性,使得产品的使用方式显而易见。
让我们看一个建立了清晰视觉信息层次的示例,并讨论建立层次时具体的设计选择。想象你是一家汽车制造商,评价某一品牌车型的两个重要维度是(1)消费者满意度和(2)汽车故障率。散点图可用于可视化当年车型与往年均值在这两个维度上的比较
无障碍的概念在于,设计应该对不同能力的人都可用。
对于数据可视化中的文字,有时可以直接在图表中注释重要或有趣的点。你可以用注释说明数据之间的细微差别,突出值得注意的内容,或者描述相关的外部因素。
研究表明,设计越美观,令人感觉越容易使用,而且随着时间的推移也更能被接受和使用,还能够促进创造性思维和解决问题,培养积极的关系,让人们更能容忍设计中存在的问题。
一个设计必须被目标受众所接受才算有效。
你可以在数据可视化设计中采用以下几种策略来获得认同。
—▼—
图表是数据分析结论最直观的展示方式。
如何决定图表的类型和数据的顺序,也会关注如何通过颜色选用、线条粗细和相对大小来强调或者弱化数据。
图表样例展示
图表类型
小结
以上就是本次分享的全部内容!当构建故事时,应该使用开头(情节)、中间(起伏)和结尾(呼吁行动)这样的形式。冲突和紧张是吸引并保持受众注意力的关键。故事的另一核心元素是叙述,我们应该从顺序(顺序或者倒序)和方式(口头叙述、书面叙述或者二者结合)的角度来考虑。我们可以利用重复的力量让受众记住我们的故事,也可以采用水平和垂直逻辑关系、反向故事板以及寻求新视角等策略确保我们的故事清晰易懂。
关于本书后续还有很多案例的讲解,感兴趣的小伙伴可以加入我们的知识星球进行交流或者领取pdf资料进一步学习。
数据分析,始于业务,用于业务,终于业务,如何做好数据分析,需要一直在探索和学习,还是那句话,有些东西你用了才知道它有用,不用它永远没用,所以学习知识是比较容易,但是把知识应用到实际的工作和生活中是比较难的事,需要我们去实践,去思考、去练习。
(个人公众号:专注于Python、SQL、数据分析、可视化、数据产品分享,放大你的价值~)
最后,祝愿大家都能在自己所在的领域内,保持着好奇心、求知欲、观察生活,在实际场景中,要有数据驱动产品闭环的思维,熟悉业务,时刻关注数据、保持敏感,成就更好的自己,在可预见的未来,遇到更好的自己。
后期内容我们还有继续为大家分享很多的关于数据分析案例以及的数据书籍内容:数据分析项目分享、商业案例分享、高阶书籍分享···
本次分享到此结束,感谢大家的收听,我们下期再会!
(点击阅读原文,加入数据分析·领地,参加我们的读书会,与大佬一起交流成长~)