最近,又有一款Python可视化工具火了。
这一次,功能是针对图聚类问题的社群结构进行检测、可视化。
该项目的帖子在reddit上一经发布,就被顶到了“机器学习板块”的榜首。
一起来看看它究竟都能用来做什么吧~
这款工具叫作communities, 是一个Python库,用于图聚类问题的社群结构检测。
它支持多种算法,包括:
更赞的是,communities还可以实现这些算法的可视化。
具体了解一下~
这里以Louvain算法为例。
这是一种基于模块度的社群发现算法,也是贪心算法。
它根据顶点的共享边将顶点排列成社群结构,也就是说,它将节点分为几个社群,每个社群之间共享很少的连接,但是同一社群的节点之间共享许多连接。
最终,让整个社群网络呈现出一种模块聚集的结构,实现整个社群网络的模块度的最大化。
所以首先,我们需要构建一个表示无向图的邻接矩阵,可以加权,也可以不加权,矩阵为2Dnumpy数组。
n*n矩阵则表示有n个节点,矩阵的每个位置分别表示各节点之间边的关系,有边则为1,没有边则为0。
然后,只需从communities.algorithms中导入算法并插入矩阵。
import numpy as np from communities.algorithms import louvain_method adj_matrix = np.array([[0, 1, 1, 0, 0, 0], [1, 0, 1, 0, 0, 0], [1, 1, 0, 1, 0, 0], [0, 0, 1, 0, 1, 1], [0, 0, 0, 1, 0, 1], [0, 0, 0, 1, 1, 0]]) communities, _ = louvain_method(adj_matrix) # >>> [{0, 1, 2}, {3, 4, 5}]
接下来输出社群列表,每个社群即为一组节点。
利用communities将图进行可视化,将节点分到社群中并进行颜色编码,还可以选择深色或浅色背景、保存图片、选择图片的分辨率等等 。
draw_communities(adj_matrix : numpy.ndarray, communities : list, dark : bool = False, filename : str = None, seed : int = 1)
其中各参数的具体含义为:
具体到Louvain算法的可视化,代码是这样的:
from communities.algorithms import louvain_method from communities.visualization import draw_communities adj_matrix = [...] communities, frames = louvain_method(adj_matrix) draw_communities(adj_matrix, communities)
communities 还可以动画呈现节点分配到社群的过程。
louvain_animation(adj_matrix : numpy.ndarray, frames : list, dark : bool = False, duration : int = 15, filename : str = None, dpi : int = None, seed : int = 2)
其中各参数的含义如下:
例如,空手道俱乐部网络中Louvain算法的动画呈现:
from communities.algorithms import louvain_method from communities.visualization import louvain_animation adj_matrix = [...] communities, frames = louvain_method(adj_matrix) louvain_animation(adj_matrix, frames)
我们可以看到Louvain算法的动态过程:
大家可以通过文末链接,自行尝试一下其他算法~
此外,它还可以用于社群间邻接矩阵、拉普拉斯矩阵以及模块度矩阵等。
对于这款工具,不少网友发出“awesome”、“really cool!”等花式赞叹,表示正是自己需要的。
当然,也有网友提出疑问,例如:是否可以指定执行的迭代次数(例如:提前停止)?
开发者对此表示:不能,但是对于某些算法,可以指定要将图形划分为多少个社群。
作者简介
项目开发者Jonathan Shobrook,他目前是美国一家电商公司的软件工程师。
之前GitHub上的热门项目Rebound,也是出自他手,已经获得3.5k星。
更多信息可戳下方链接了解~
相关链接:
[1]https://github.com/shobrook/communities
[2]https://www.reddit.com/r/MachineLearning/comments/lozys9/p_i_made_communities_a_library_of_clustering/
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
领取专属 10元无门槛券
私享最新 技术干货