今天给大家推荐一本超级棒的R绘图,给你的R绘图书单新增一本书吧:《Fundamentals of Data Visualization》。
推荐理由:
《Fundamentals of Data Visualization》这本书,写的非常不错,里面主要不是讲如何用代码绘图的,而是讲图片美观好用的各个规则,比如图例调整,颜色选择等等。
这本书可以在线观看查阅 https://clauswilke.com/dataviz/
这本书的由来:
作者在实验室与学生和博士后合作,处理了数千个数据可视化项目。在这些经验中,作者发现一些常见问题反复出现。因此,将多年积累的知识和经验整理成书,以帮助读者避免常见错误并提高可视化技能。
本书的源代码托管在 GitHub 上,热河绘图代码都可以公开查看,地址是:https://github.com/clauswilke/dataviz。
数据可视化的重要性
如果你是一名科学家、分析师、顾问,或者任何需要准备技术文件或报告的人,你需要掌握的最重要的技能之一就是制作有说服力的数据可视化图表,通常是图形的形式。图形通常会承载你论点的大部分重量。它们需要清晰、吸引人且有说服力。好的图形和坏的图形之间的区别,可能就是一篇极具影响力或默默无闻的论文的区别,一个获得或失去的资助或合同的区别,以及一次面试成功或失败的区别。
本书的内容虽然按照逻辑顺序编排,但大多数章节可以独立阅读,无需从头到尾依次阅读。
本书讨论的是图形制作的一般原则。
来看一下图形的好坏与否的示例
- (a) 一个条形图,显示三个值(A = 3,B = 5,C = 4)。这是一个合理的可视化,没有重大缺陷;
- (b) (a)部分的丑陋版本。尽管该图在技术上是正确的,但并不美观。颜色过于鲜艳且没有实际用途。背景网格过于突出。文本以三种不同的字体和三种不同的字号显示;
- (c) (a)部分的糟糕版本。每个条形都有自己的y轴刻度。由于刻度不一致,这使得图形具有误导性。人们很容易误以为这三个值之间的差距比实际更小;
- (d) (a)部分的错误版本。没有明确的y轴刻度,条形所代表的数值无法确定。条形看起来的长度分别是1、3和2,尽管实际显示的值应该是3、5和4。
这本书主要有三大部分
part1:From data to visulaization
part2:Principles of figure design
part3:Miscellaneous topics
书的目录如下:
- Introduction 介绍
- Visualizing data: Mapping data onto aesthetics 数据可视化:将数据映射到视觉元素
- Coordinate systems and axes 坐标系统和轴
- Color scales 颜色比例尺
- Directory of visualizations 可视化目录
- Visualizing amounts 数量可视化
- Visualizing distributions: Histograms and density plots 可视化分布:直方图和密度图
- Visualizing distributions: Empirical cumulative distribution functions and q-q plots 可视化分布:经验累积分布函数和Q-Q图
- Visualizing many distributions at once 同时可视化多个分布
- Visualizing proportions 比例可视化
- Visualizing nested proportions 嵌套比例可视化
- Visualizing associations among two or more quantitative variables 可视化两个或多个定量变量之间的关联
- Visualizing time series and other functions of an independent variable 时间序列和其他独立变量函数的可视化
- Visualizing trends 趋势可视化
- Visualizing geospatial data 地理空间数据可视化
- Visualizing uncertainty 不确定性可视化
- The principle of proportional ink 成比例墨水原则
- Handling overlapping points 处理重叠点
- Common pitfalls of color use 颜色使用的常见陷阱
- Redundant coding 冗余编码
- Multi-panel figures 多面板图形
- Titles, captions, and tables 标题、说明和表格
- Balance the data and the context 数据与上下文的平衡
- Use larger axis labels 使用更大的轴标签
- Avoid line drawings 避免使用线条图
- Don’t go 3D 不要使用3D图形
- Understanding the most commonly used image file formats 理解最常用的图像文件格式
- Choosing the right visualization software 选择合适的可视化软件
- Telling a story and making a point 讲述故事和突出重点
- Annotated bibliography 注释书目
本书的内容虽然按照逻辑顺序编排,但大多数章节可以独立阅读,无需从头到尾依次阅读。