但是随着流量潮水逐渐褪去,我开始有这样一个疑问,能不能定量分析下,通过苏轼,到底能联系起来多少位人物?
这里及下文的联系都不只限于人物A认识人物B这一种,还包括A给B著书立说、写墓志铭、追忆缅怀等,所以很明显可以这种联系可以跨越朝代; 讨论的对象只限于名人,不包括未在史料中记载的仆人、偶遇路人等等无法统计的。
这个问题其实是一个递归问题,
1、第一步,我只认识苏轼,能够联系到多少人,这里只有一跳,就是从苏轼到和苏轼有直接联系的人。
2、第二步,在第一步的基础上,从和苏轼有直接联系的人出发,到达和这些人有直接联系的人,也是就和苏轼有间接联系的人,这里的最大网络拓扑跳数为二。
3、第三步,以此类推,理论上最大跳数可以从 3 增长至无穷大。
把每一步的网络拓扑图的节点数(人物数)和连边数(关系数),统计如下:
N = 1, nodes 324, links 323
N = 2, nodes 3521, links 4763
N = 3, nodes 8284, links 20214
N = 4, nodes 11675, links 44253
N = 5, nodes 15595, links 77194
N = 6, nodes 18286, links 119067
N = 7, nodes 19606, links 164518
N = 8, nodes 20151, links 211114
N = 9, nodes 20423, links 258287
N = 10, nodes 20466, links 305555
N = 11, nodes 20480, links 352855
N = 12, nodes 20485, links 400165
还是画个图更形象一点
第一个图是联系人物数随最大跳数的变化图,可以看到,最大跳数超过 6 以后,新联系到的人物就非常少了,最开始的增长几千,到最后只新联系到 5 个人物。
第二个图是人物关系对数随最大跳数的变化图,无论是人物数快速增长还是缓慢增长,人物关系数都很明显一直在稳步增加,也就是网络图的密度在增加,关系数的理论上限应该是 n*(n-1)/2,其中 为节点数,尽管 n 在 20000 左右的时候停滞不前,距离关系数的理论上限20,000x10,000~=2,000,000 ,最大跳数等于 12 时的关系对数 40,0000 仍有增长空间。
回到正题,也就是说,通过苏轼,最多能联系的人物数大概在 20,000 左右,需要震惊的是,这 20,000 个人物,都是名人大 V,苏东坡真是龙卷风中心呀
最后依次将最大拓扑跳数 N 从 1、2、3~10、11、12 时候的 12 张网络拓扑图可视化如下: