来源:余政彦
关系网络可视化之node-link:点与线构成的网络科学(network science)
移除我在美国东北大学信息设计艺术硕士项目(Master of Fine Arts in Information Design and Visualization)就读的第三个学期(2017秋季)修了四门课,其中一门课專注关系网络可视化(network visualization,又称graph visualization,图可视化)的探索与实践,属于计算机科学系博士班课程,一周上两次。
Cody Dunne
授课老师是Cody Dunne,在马里兰大学取得硕士与博士学位,师从Ben Shneiderman大神。Cody他专注在信息可视化、网络科学、人机交互等,在进入东北大学教书之前,他曾担任IBM研究单位的科学家。这门课配有两个助教(研究领域皆是关系网络可视化),负责解决作业问题与其他课程需求。
这门课是我在美国这一年半以来选到压力最大的一门,因为它属于计算机科学系博士班的课程,所以会有许多文献需要阅读;另外,部分作业很要求编程的能力;再加上每周需要上两次课,通常课程只需要一周上一次,每次三个半小时,这门课被切成两半,虽然总上课时数没有变,但课程压力增加许多,作业与每周阅读文献的量变成一般课程的两倍,例如周二上完课,我们必须在下一次上课前一天,也就周三(隔天周四上第二次课)之前到课程论坛上传文献阅读心得。
具体课程作业要求:
整个学期总共38篇文献需要阅读(每周约5至7篇,集中在课程前半部分),需要上传阅读心得(且带批判思维,不能只是梳理文献结果),然后上课的时候有小考。
整个学期有5门作业:
图可视化工具实操(两人一组上台报告展示)、
2个D3可视化实作(一个为基础的图可视化实现,另一个为实现仪表板的交互可视化)、
文献报告(一人一组,选一篇文献上台报告)、
用代码实现一个经典的图可视化算法(是所有作业里的大魔王,反正我是花了两个整天耗在图书馆还是没有完成。。。)
期末专题:2至3人一组,与业界人士合作(从他们那边拿数据与了解他们的需求于需解决的问题),完成一个完整的图可视化开发(从草拟到可交互的交互可视化、撰写符合规范期刊格式的论文、上台报告展示等)
课程的详细信息与课件皆可以在这个网站查看与下载:https://codydunne.github.io/cs7295-f17
关系网络可视化,简而言之是用点(nodes)与线(edges)或矩阵(matrix)去呈现复杂数据之间的网络关系。这一系列的文章共有7篇(包括本篇),预计一周发一篇(求鞭策hhh),主要梳理了我在这门课学到的知识,从阅读文献到实际做一个关系网络可视化项目:
开篇简介
简要介绍关系网络可视化系列文章的内容。
文献泛读之1: node-link(点线) & matrix(矩阵)
牵涉到关系网络可视化的种类,大致可以分成两个类型,一个是使用node-link(点线)、另一个是使用matrix(矩阵)。在课堂的文献阅读中,可以很明显的了解,呈现关系网络可视化主要分成这两个阵营。node-link(点线)可以呈现较多细节资讯,但容易使关系网络可视化变得很复杂;matrix(矩阵)可以大幅简化关系网络,并清楚呈现两两之间的关系,但同时也遗失了关系网络数据中的部分重要信息,像是无法呈现地理信息。两者间的爱恨情仇会在这篇大致梳理。
a) Node-link 点线 & b) Matrix 矩阵
文献泛读之2: 可视化的视觉呈现
包括关系网络可视化,在呈现数据可视化时,需要注意颜色以及其他视觉元素的使用,如何避免使用错误的颜色而造成曲解、如何使用格式塔法则(Gestalt Principles)来辅助可视化,将在此文探讨。
使用彩虹色阶(左边)容易产生视觉曲解
文献泛读之3: 辅助视角的呈现(integration & coordinated views)
此章节会介绍如何使用其他数据可视化的样式来辅助关系网络可视化。如同仪表盘(dashboard),关系网络也会需要其他可视化来帮助使用者来探索与深入了解数据之间的网络关系。
移除左右两个不同视角的可视化可以辅助使用者了解同一个数据
左右两个不同视角的可视化可以辅助使用者了解同一个数据
关系网络可视化工具:gephi
选一个网络可视化工具并上台报告是这门课的作业之一,可以选择的工具有:Gephi、NodeXL、Cytoscape 、Tulip、Visone 等等,我们这组(两个人)选了gephi。gephi的特色在易于操作以及可以呈现动态网络关系等,但因为它也是一个开源的工具,所以有许多坑。此篇将手把手讲解如何使用Gephi的基本功能以及会遇到的问题。
gephi
文献报告
此篇也是课堂的其中一个作业,每个人需要选一篇文献(由老师列出,其他文献可以在课程网站的Paper Presentations查看)精读并上台报告。我选的是《Many-to-Many Geographically-Embedded Flow Visualisation- An Evaluation》,发表于2016年。对于我而言,这篇论文的特点在于列举的文献与数理相当具有逻辑,可以从这篇文章的文献综述去了解为何作者要提出一个新的关系网络可视化样式来解决问题;另外,文章中详细讲解一个新的关系网络可视化样式的设计过程以及如何设计实验来检测该可视化,也是我获益良多的部分。
如何在node-link与matrix之间取舍,是此篇文献的一个重点
期末项目
作为课程的重点项目,我跟一个同学合作,从数据选取、问题探索、可视化样式脑力激荡、编程使用,从头到尾的做出一个可以交互的可视化与一篇结构完整、已经可以发表的论文。此篇将呈现整个项目设计过程。
期末项目的截图
以上,新年快乐。
参考文献:
M. Ghoniem, J.-D.Fekete, and P. Castagliola, “A Comparison of theReadability of Graphs Using Node-Link and Matrix-Based Representations,”IEEE Symposium on Information Visualization, 2004.
Stef van den Elzenand Jarke J. van Wijk, “Multivariate NetworkExploration and Presentation: From Detail to Overview via Selections andAggregations,” 2014.
Michelle A. Borkinet al., “Evaluation of Artery Visualizations for HeartDisease Diagnosis,” 2011.
Yalong Yang et al., “Many-to-ManyGeographically-Embedded Flow Visualisation- An Evaluation,” 2016.
关注@图纸集
【精彩数据可视化文章推荐】
1、6张图解析美国基础设施现状
2、【2017年全球大学毕业生就业竞争力排行榜】
3、世界上的幸运数字和倒霉数字
4、美联储加息后中国央行会不会跟进?
5、赴韩团体游中断的八个月:中国游客虽减半,仍是第一客源国
6、50万美元在美国各城市能买多大的房子?
7、图解:宇宙中最快的飞行器
8、图解: 1990年 - 2020年,中国地铁如何快速扩张
9、图解:哪些电影影评人喜欢,观众却不买账
领取专属 10元无门槛券
私享最新 技术干货