研究背景
位置感知设备和技术的发展使我们能够获取海量类型多样的空间交互数据,这种数据常被用于区域空间结构、用地功能特征和人类活动规律等研究。作为地理分析的基本方法和工具之一,可视化以地图、数据图表等形式呈现数据的空间分布模式,同样是空间交互研究的重要方向。一方面,一个地理单元的空间交互模式与该地理单元的属性紧密相关,可以用一些统计量(如交互强度、角度、距离分布)进行概括来反映局部的交互模式,进而通过可视化这种局部模式揭示区域的功能和位置特征;另一方面,空间交互数据也与人活动行为的时间节律有关,不同时间段的空间交互数据可视化体现了居民的出行规律。早期的空间交互可视化方法包括流地图(flow map)和OD矩阵,然而它们难以直接应用于时空上高度连续的空间交互大数据。例如,流地图将不可避免地产生交叠问题,同时OD矩阵也会因空间单元的增多和空间交互分布的不均匀分布变得庞大和稀疏。虽然许多改进的和新的可视化方法相继被提出,如流的边捆绑技术、矩阵重排、OD Map、MobilityGraph、分区组合统计图、弦图等,但它们或者没有对空间交互特征进行概括,或者仍会遇到可视化符号的交叠问题。本研究提出了一种新的空间交互的可视化方法:Direction-based pattern maps,通过对空间交互数据在基本方向上进行聚合体现空间交互模式。该方法使用空间规则多边形划分避免了可视化的交叠问题,通过数据聚合实现了交互特征的提取。
可视化设计
空间交互具有三个重要属性:距离(distance)、方向(direction)和强度(magnitude)。前两个为空间属性,可由交互的起止点坐标计算得到;强度与数据采集方式和空间尺度相关。我们选用方向作为数据聚合的基准因为它更能体现区域空间结构,如带状、放射型的城市形态决定了居民主要出行方向,而距离和强度仅与城市规模和人口活动强度相关。可视化设计主要包括以下四个步骤:
(1)空间划分。我们使用正六边形网格的划分方式,其大小可根据所研究的空间尺度决定。其他划分方法如交通分析单元(traffic analysis zones, TAZs),区域的形状、大小不一,会使可视化显示杂乱。而规则多边形排布整齐、大小一致,提升了读图效率和舒适感。相较于正方形网格,正六边形在可视化效果上具有一定优势。正六边形网格具有更加紧凑的空间结构,每一对相邻六边形都是边相邻。相关研究也证明了正六边形可以减少空间采样误差,降低空间不确定性。此外,正方形网格中的每一行和每一列形成的横线和纵线会分散人眼的注意力。使用正六边形网格进行空间划分,每个六边形单元代表一个区域,在保持空间拓扑关系的同时能够避免可视化图形交叠问题。
(2)可视化图形设计。图1展示了基于六方向的可视化图形。通过将每个多边形进一步分割成三角形,用其颜色表示不同方向上聚合的空间交互强度,边的颜色表示相应的交互距离。考虑合适的基本方向数量的选择,一般来说,较多方向使得六边形呈现的模式与真实空间交互分布更加接近,但会为人眼识别带来困难。同时,交互模式将更加破碎和稀疏(即很多方向上没有空间交互)而难以解读。方向数较少则会导致较大的信息损失,无法准确的刻画交互特征。综上,我们推荐使用6个或者12个基本方向,这也能与六边形能更好地契合,并且分割成的三角形是全等的,不会带来不协调感。
图1 基于六方向的可视化图形
(3)空间数据聚合。如图2所示,对于每个六边形单元,在每个方向上的n个空间交互数据{(m1,d1), (m2,d2),…, (mi,di),…,(mn,dn)},其中mi和di分别表示第i个交互的强度和距离,使用公式(1)和(2)分别计算该方向上聚合的空间交互强度am和距离ad:
如果该方向上没有数据,则am和ad的值均为0。在公式(1)中我们直接对交互量加和得到了总的交互量;在公式(2)中,我们更加关注强度高的那部分交互,因此用交互量对距离计算进行了加权。
图2 空间交互数据在六个方向上进行聚合
(虚线和颜色表示方向,线宽表示交互强度)
(4)地图颜色设置。如图3所示,我们使用两种颜色模式以避免混淆:灰度色阶表示交互强度由低至高,橙红色阶(OrRd)表示距离由近及远。不建议直接根据am或ad的值按比例着色,因为容易受极端值的影响,分级设色则是比较好的方式,研究中使用的是Jenks natural breaks方法。由于交互距离由线段表示,为防止识别困难,建议选取四到七级橙红色阶;为显示交互强度的梯度层次感,建议使用十到十五级灰度色阶。
图3 交互强度和距离的颜色模式
案例分析
我们使用北京五环区域内2013年5月四个工作日的一百万条出租车OD数据进行可视化,如图4所示,其中六边形数量为291,边长为一千米。为显示出租车流在不同时间段内的分布模式,我们以四小时为间隔切分了数据。图4展示了凌晨和早高峰期间每个区域到其他区域的出租车出行模式。可以发现内部区域灰度较深,是出行集中的区域,位于区域边缘的六边形红边较多,表示这些区域出行距离较长。图中同时标注了几个典型区域。凌晨时分,三里屯附近夜生活丰富,打车较多,此外海淀区的五道口商圈也具有较多的叫车量。位于中心的故宫由于位置特殊,打车量一直较少,而北京西站两个时段的模式差异明显。就居民出行而言,可以推断研究区域边缘地区的居民花费在通勤上的时间较长,出行方向指向区域内部。在早高峰期间,内部区域不少六边形有一条红色的边,指向位于东北部的首都国际机场,可见打车赶早间航班是比较普遍的现象。
(a) 凌晨(1-5 a.m.)
(b) 早高峰(5-9 a.m.)
图4 出租车出行数据可视化
讨论
在对原始数据进行概括、综合并以各种形式进行可视化的过程中,信息损失不可避免。一般来说,可视化越复杂、数据聚合程度越低,就越能反映更多的信息,但也需要花费更多时间去理解。因此需要对可视化效果与信息损失程度进行权衡。在我们的方法中,对数据进行聚合无疑是导致信息损失的主要因素,然而聚合的过程也是空间交互特征提取的过程,有助于发现不同区域的空间交互模式。为降低可视化图形的复杂度,我们也尝试使用了二元颜色模式进行可视化,仅用三角形的颜色同时反映交互强度和距离。图5展示的是早高峰期间的出租车数据,其中六级红色色阶和四级蓝色色阶混合得到了24级二元色阶。二元颜色模式降低了符号的复杂度,但增加了颜色的辨识难度。此外,我们还将可视化方法用于轨迹数据,图6清晰地呈现出北京环路结构和机场快速路。
图5 二元颜色模式可视化(早高峰出租车流)
图6 早高峰出租车轨迹可视化
结论
本研究提出的可视化方法能够揭示局部和全局的空间交互特征,不仅能较好地揭示空间交互模式与区域功能位置特征的关系,也可以体现不同区域的出行特点,对研究区域空间结构和居民移动模式具有参考意义,并且在可视化系统中可以与流地图等结合,互为补充,全面地展示空间交互特征和及其分布。
素材来源:S³-Lab
材料整理:姚 欣
内容排版:丁 鼎
领取专属 10元无门槛券
私享最新 技术干货