文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

这个图聚类Python工具火了:社群结构可视化、检测

2024-12-03 10:52

关注

 最近,又有一款Python可视化工具火了。

这一次,功能是针对图聚类问题的社群结构进行检测、可视化。

该项目的帖子在reddit上一经发布,就被顶到了“机器学习板块”的榜首

一起来看看它究竟都能用来做什么吧~

功能亮点

这款工具叫作communities, 是一个Python库,用于图聚类问题的社群结构检测。

它支持多种算法,包括:

更赞的是,communities还可以实现这些算法的可视化

具体了解一下~

导入算法并插入矩阵

这里以Louvain算法为例。

这是一种基于模块度的社群发现算法,也是贪心算法。

它根据顶点的共享边将顶点排列成社群结构,也就是说,它将节点分为几个社群,每个社群之间共享很少的连接,但是同一社群的节点之间共享许多连接。

最终,让整个社群网络呈现出一种模块聚集的结构,实现整个社群网络的模块度的最大化。

所以首先,我们需要构建一个表示无向图的邻接矩阵,可以加权,也可以不加权,矩阵为2Dnumpy数组。

n*n矩阵则表示有n个节点,矩阵的每个位置分别表示各节点之间边的关系,有边则为1,没有边则为0。

然后,只需从communities.algorithms中导入算法并插入矩阵。

  1. import numpy as np 
  2. from communities.algorithms import louvain_method 
  3. adj_matrix = np.array([[011000], 
  4.                        [101000], 
  5.                        [110100], 
  6.                        [001011], 
  7.                        [000101], 
  8.                        [000110]]) 
  9. communities, _ = louvain_method(adj_matrix) 
  10. # >>> [{012}, {345}] 

接下来输出社群列表,每个社群即为一组节点。

实现可视化,并进行颜色编码

利用communities将图进行可视化,将节点分到社群中并进行颜色编码,还可以选择深色或浅色背景、保存图片、选择图片的分辨率等等 。

draw_communities(adj_matrix : numpy.ndarray, communities : list, dark : bool = False, filename : str = None, seed : int = 1)

其中各参数的具体含义为:

具体到Louvain算法的可视化,代码是这样的:

  1. from communities.algorithms import louvain_method 
  2. from communities.visualization import draw_communities 
  3. adj_matrix = [...] 
  4. communities, frames = louvain_method(adj_matrix) 
  5. draw_communities(adj_matrix, communities) 

动画呈现算法

communities 还可以动画呈现节点分配到社群的过程。

louvain_animation(adj_matrix : numpy.ndarray, frames : list, dark : bool = False, duration : int = 15, filename : str = None, dpi : int = None, seed : int = 2)

其中各参数的含义如下:

例如,空手道俱乐部网络中Louvain算法的动画呈现:

  1. from communities.algorithms import louvain_method 
  2. from communities.visualization import louvain_animation 
  3. adj_matrix = [...] 
  4. communities, frames = louvain_method(adj_matrix) 
  5. louvain_animation(adj_matrix, frames) 

我们可以看到Louvain算法的动态过程:

大家可以通过文末链接,自行尝试一下其他算法~

此外,它还可以用于社群间邻接矩阵、拉普拉斯矩阵以及模块度矩阵等。

对于这款工具,不少网友发出“awesome”、“really cool!”等花式赞叹,表示正是自己需要的。

当然,也有网友提出疑问,例如:是否可以指定执行的迭代次数(例如:提前停止)?

开发者对此表示:不能,但是对于某些算法,可以指定要将图形划分为多少个社群。

作者简介

[[383607]]

项目开发者Jonathan Shobrook,他目前是美国一家电商公司的软件工程师。

之前GitHub上的热门项目Rebound,也是出自他手,已经获得3.5k星。

更多信息可戳下方链接了解~

相关链接:

[1]https://github.com/shobrook/communities

[2]https://www.reddit.com/r/MachineLearning/comments/lozys9/p_i_made_communities_a_library_of_clustering/

 

来源:量子位内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯