广西师范大学学报(自然科学版) ›› 2024, Vol. 42 ›› Issue (2): 105-119.doi: 10.16088/j.issn.1001-6600.2023052903

• • 上一篇    下一篇

基于矩阵运算加速的改进社区发现遗传算法

余谦, 陈庆锋*, 何乃旭, 韩宗钊, 卢家辉   

  1. 广西大学 计算机与电子信息学院, 广西 南宁 530004
  • 收稿日期:2023-05-29 修回日期:2023-09-05 发布日期:2024-04-22
  • 通讯作者: 陈庆锋(1972—), 男, 广西柳州人, 广西大学教授, 博士。 E-mail: qingfeng@gxu.edu.cn
  • 基金资助:
    国家自然科学基金(61963004, 61862006)

Genetic Algorithm for Community Detection Accelerated by Matrix Operations

YU Qian, CHEN Qingfeng*, HE Naixu, HAN Zongzhao, LU Jiahui   

  1. School of Computer Electronics and Information, Guangxi University, Nanning Guangxi 530004, China
  • Received:2023-05-29 Revised:2023-09-05 Published:2024-04-22

摘要: 社区发现算法是复杂网络领域的重要研究工具,然而传统的社区发现遗传算法在大规模网络下存在初始种群质量不佳和运行效率低下的问题。为此,本文提出一种基于矩阵运算加速的改进社区发现遗传算法。针对初始种群质量不佳的问题,提出一种新的初始化算子,采用闭包系数有偏向地选择节点构建高质量初始社区;针对计算效率低下的问题,基于矩阵运算重构了传统社区发现遗传算法各个算子,使得算法能使用GPU加速,提升计算效率。仿真实验结果表明,在不同规模的真实网络和LFR合成网络下,本文算法既能保证良好的划分精度,又展现出较其他主流同类算法更高的计算效率。

关键词: 复杂网络, 社区发现, 遗传算法, 矩阵运算, 模块度

Abstract: Community detection algorithms are critical research tools in the field of complex networks. However, traditional community detection genetic algorithms have the problems with poor initial population quality and low computational efficiency under large-scale networks. To address this, an improved community detection genetic algorithm based on matrix computation acceleration is proposed. To tackle the problem of subpar initial population quality, a novel initialization operator is proposed to construct high-quality initial communities using the closure coefficient with biases node selection. To address the issue of low computational efficiency, the traditional community detection genetic algorithm operators are restructured based on matrix operations, enabling the use of GPU acceleration to enhance computational efficiency. Experimental results indicate that the proposed algorithm maintains good partitioning accuracy and demonstrates higher computational efficiency than other algorithms of the same type under different scales of real networks and LFR synthetic networks.

Key words: complex network, community detection, genetic algorithm, matrix operation, modularity

中图分类号:  TP18

[1] 乔雨露. 基于亲和传播的复杂网络社团探测方法研究[D].南宁:广西大学,2021.DOI:10.27034/d.cnki.ggxiu.2021.000715.
[2] 黄杰,武瑞梓,李均利.进化算法在复杂网络中的应用综述[J].计算机系统应用,2023,32(4):16-41. DOI:10.15888/j.cnki.csa.009037.
[3] 刘扬,郑文萍,张川,等.一种基于局部随机游走的标签传播算法[J].计算机科学,2022,49(10):103-110.DOI:10.11896/jsjkx.220400145.
[4] 曾祥宇,龙海霞,杨旭华.基于马尔可夫相似性增强和网络嵌入的社区发现[J].计算机科学,2023,50(4):56-62.DOI:10.11896/jsjkx.220100155.
[5] 杨煜,段威威.基于谱聚类的社交网络动态社区发现算法[J].计算机应用,2023,43(10):3129-3135. DOI:10.11772/j.issn.1001-9081.2022101517.
[6] 付立东,刘佳会,王秋红.基于密度峰值的标签传播社区发现算法[J].计算机应用研究,2023,40(8):2323-2328. DOI:10.19734/j.issn.1001-3695.2002.12.0796.
[7] 刘志远. 复杂网络中的社团探测研究及应用[D].济南:山东师范大学,2020.DOI:10.27280/d.cnki.gsdsu.2020.002123.
[8] JAVEDM A, YOUNIS M S, LATIF S, et al. Community detection in networks: a multidisciplinary review[J]. Journal of Network and Computer Applications, 2018, 108: 87-111.DOI: 10.1016/j.jnca.2018.02.011.
[9] BUI T N, JONES C. Finding good approximate vertex and edge partitions is NP-hard[J]. Information Processing Letters, 1992, 42(3): 153-159. DOI: 10.1016/0020-0190(92)90140-Q.
[10] GUO X C, SU J, ZHOU H, et al. Community detection based on genetic algorithm using local structural similarity[J]. IEEE Access, 2019, 7: 134583-134600.DOI: 10.1109/ACCESS.2019.2939864.
[11] 李萍,汪芬,陈祺东,等.求解多目标社区发现问题的离散化随机漂移粒子群优化算法[J].计算机应用,2021,41(3):803-811.DOI:10.11772/j.issn.1001-9081.2020060800.
[12] 顾军华,江帆,武君艳,等.基于标签传播的蚁群优化算法求解社区发现问题[J].计算机应用与软件,2019,36(6):233-242.DOI: 10.3969/j.issn.1000-386x.2019.06.043.
[13] TASGIN M, HERDAGDELEN A, BINGOL H. Community detection in complex networks using genetic algorithms[EB/OL]. (2007-11-04)[2023-05-29].https://arxiv.org/abs/0711.0491.DOI: 10.48550/arXiv.0711.0491.
[14] CHEN K Q, BI W H. A new genetic algorithm for community detection using matrix representation method[J]. Physica A: Statistical Mechanics and its Applications, 2019, 535: 122259. DOI:10.1016/j.physa.2019.122259.
[15] SAID A, ABBASI R A, MAQBOOL O, et al. CC-GA: a clustering coefficient based genetic algorithm for detecting communities in social networks[J]. Applied Soft Computing, 2018, 63: 59-70.DOI: 10.1016/j.asoc.2017.11.014.
[16] SHISHAVAN S T, GHAREHCHOPOGH F S. An improved cuckoo search optimization algorithm with genetic algorithm for community detection in complex networks[J]. Multimedia Tools and Applications, 2022, 81(18): 25205-25231. DOI: 10.1007/s11042-022-12409-x.
[17] SHAKYA H K, SINGH K, MORE Y S, et al. Opposition-based genetic algorithm for community detection in social networks[J]. Proceedings of the National Academy of Sciences, India Section A: Physical Sciences, 2022, 92(2): 251-263. DOI: 10.1007/s40010-020-00716-7.
[18] GUERRERO M, MONTOYA F G, BAÑOS R, et al. Adaptive community detection in complex networks using genetic algorithms[J]. Neurocomputing, 2017, 266: 101-113. DOI: 10.1016/j.neucom.2017.05.029.
[19] MENG X Y, DONG L Y, LI Y L, et al. A genetic algorithm using K-path initialization for community detection in complex networks[J]. Cluster Computing, 2017, 20(1): 311-320. DOI:10.1007/s10586-016-0698-y.
[20] BOUKARAM W, TURKIYYAH G, KEYES D. Hierarchical matrix operations on GPUs: matrix-vector multiplication and compression[J]. ACM Transactions on Mathematical Software, 2019, 45(1): 3. DOI:10.1145/3232850.
[21] HRICIK T, BADER D, GREEN O. Using RAPIDS AI to accelerate graph data science workflows[C]// 2020 IEEE High Performance Extreme Computing Conference (HPEC).Los Alamitos, CA: IEEE Computer Society, 2020: 1-4.DOI: 10.1109/HPEC43674.2020.9286224.
[22] PASZKE A, GROSS S, MASSA F, et al. PyTorch: an imperative style, high-performance deep learning library[EB/OL]. (2019-12-03)[2023-05-29].https://arxiv.org/abs/1912.01703. DOI: 10.48550/arXiv.1912.01703.
[23] ZHAN Z H, ZHANG J, LIN Y, et al. Matrix-based evolutionary computation[J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 2022, 6(2): 315-328.DOI: 10.1109/TETCI.2020.3047410.
[24] YIN H, BENSON A R, LESKOVEC J. The local closure coefficient: a new perspective on network clustering[C]// WSDM ’19: Proceedings of the Twelfth ACM International Conference on Web Search and Data Mining. New York, NY: Association for Computing Machinery,2019: 303-311.DOI: 10.1145/3289600.3290991.
[25] NEWMAN M E J. Modularity and community structure in networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2006, 103(23): 8577-8582. DOI:10.1073/pnas.0601602103.
[26] SHI C, YAN Z Y, WANG Y, et al. A genetic algorithm for detecting communities in large-scale complex networks[J]. Advances in Complex Systems, 2010, 13(1): 3-17. DOI:10.1142/S0219525910002463.
[27] PIZZUTI C. Evolutionary computation for community detection in networks: a review[J]. IEEE Transactions on Evolutionary Computation, 2018, 22(3): 464-483.DOI: 10.1109/TEVC.2017.2737600.
[28] MAJEED A, RAUF I. Graph theory: a comprehensive survey about graph theory applications in computer science and social networks[J]. Inventions, 2020, 5(1): 10.DOI: 10.3390/inventions5010010.
[29] 汤洋,赵达非,黄智濒,等.高性能行任务散列法GPU一般稀疏矩阵-矩阵乘法[J].北京邮电大学学报,2019,42(3):106-113.DOI:10.13190/j.jbupt.2018-252.
[30] LE GALL F. Powers of tensors and fast matrix multiplication[C]// Proceedings of the 39th International Symposium on Symbolicand Algebraic Computation. New York, NY: Association for Computing Machinery,2014: 296-303.DOI: 10.1145/2608628.2608664.
[31] DOBRAVEC T, BULIĆ P. Comparing CPU and GPU implementations of a simple matrix multiplication algorithm[J]. International Journal of Computer and Electrical Engineering, 2017, 9(2): 430-438. DOI:10.17706/IJCEE.2017.9.2.430-438.
[32] ROSSI R, AHMED N. The network data repository with interactive graph analytics and visualization[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2015, 29(1):4292-4293. DOI: 10.1609/aaai.v29i1.9277.
[33] LANCICHINETTI A, FORTUNATO S, RADICCHI F. Benchmark graphs for testing community detection algorithms[J]. Physical Review E, 2008, 78(4): 046110. DOI: 10.1103/PhysRevE.78.046110.
[34] 赵卫绩,张凤斌,刘井莲.复杂网络社区发现研究进展[J].计算机科学,2020,47(2):10-20.DOI:10.11896/jsjkx.190100214.
[1] 赵明, 罗秋莲, 陈蔚萌, 陈嘉妮. 控制时机和力度对传染病传播的影响[J]. 广西师范大学学报(自然科学版), 2023, 41(2): 86-97.
[2] 肖飞, 康增彦, 王维红. 两种算法用于预测A2/O工艺脱氮条件[J]. 广西师范大学学报(自然科学版), 2022, 40(6): 173-184.
[3] 朱恩文, 朱安麒, 王洁丹, 刘玉娇. 基于EEMD-GA-BP模型的风电功率短期预测研究[J]. 广西师范大学学报(自然科学版), 2022, 40(1): 166-174.
[4] 翁小雄, 谢志鹏. 基于多层复杂网络的高速公路节点重要性研究[J]. 广西师范大学学报(自然科学版), 2021, 39(5): 78-88.
[5] 胡竣涛, 时小虎, 马德印. 基于均值漂移和遗传算法的护工调度算法[J]. 广西师范大学学报(自然科学版), 2021, 39(3): 27-39.
[6] 何韩吉, 邓光明, 葛梦兰. 中原城市群空气质量空间关联研究[J]. 广西师范大学学报(自然科学版), 2021, 39(3): 151-162.
[7] 许伦辉, 曹宇超, 林培群. 基于融合免疫优化和遗传算法的多应急物资中心选址与调度[J]. 广西师范大学学报(自然科学版), 2020, 38(6): 1-13.
[8] 叶青, 黄强, 聂斌, 李欢. 一种自适应的高维离群点识别方法[J]. 广西师范大学学报(自然科学版), 2020, 38(2): 107-114.
[9] 李珏璇, 赵明. 网络的平均度和规模对部分同步状态的影响[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 115-124.
[10] 梁晓萍,罗晓曙. 基于遗传自适应的维纳滤波图像去模糊算法[J]. 广西师范大学学报(自然科学版), 2017, 35(4): 17-23.
[11] 王 意,邹艳丽,李 可,黄 李. 分布式电站入网方式对电网同步的影响[J]. 广西师范大学学报(自然科学版), 2017, 35(4): 24-31.
[12] 刘伟铭, 李荣荣, 王超, 黄玲. 高速公路通行卡调拨问题的遗传算法[J]. 广西师范大学学报(自然科学版), 2016, 34(1): 1-8.
[13] 刘宏, 王其涛, 夏未君. 基于量子遗传算法的WSN三维定位方法[J]. 广西师范大学学报(自然科学版), 2015, 33(4): 49-54.
[14] 乐美龙, 高金敏. 轮辐式航线网络下机型分配与舱位控制的协同优化研究[J]. 广西师范大学学报(自然科学版), 2014, 32(3): 33-40.
[15] 赵新超, 吴召军. 求解背包问题的多位极贪婪遗传算法[J]. 广西师范大学学报(自然科学版), 2013, 31(4): 41-47.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 袁静静, 郑宇钊, 徐晨枫, 殷婷婕. 非内吞依赖型生物大分子药物胞质递送策略研究进展[J]. 广西师范大学学报(自然科学版), 2024, 42(1): 1 -8 .
[2] 涂广升, 孔咏骏, 宋哲超, 叶康. 密文域可逆信息隐藏研究进展及技术难点分析[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 1 -15 .
[3] 杨杨阳, 朱震霆, 杨翠萍, 李世豪, 张舒, 范秀磊, 万蕾. 基于文献计量学分析的剩余污泥厌氧消化预处理研究进展[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 16 -29 .
[4] 许伦辉, 李金龙, 李若南, 陈俊宇. 基于动态生成对抗网络的路网缺失交通数据修复[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 30 -40 .
[5] 杨海, 谢亚琴. 基于Floyd算法的5G基站区域储能分配策略[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 41 -54 .
[6] 闫文文, 文中, 王爽, 李国祥, 王博宇, 吴艺. 基于AA-CAES电站和综合需求响应的供暖期弃风消纳策略[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 55 -68 .
[7] 甘友春, 王灿, 贺旭辉, 张羽, 张雪菲, 王帆, 喻亚洲. 考虑光热电站和柔性负荷的电氢热综合能源系统联合优化运行[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 69 -83 .
[8] 王旭阳, 王常瑞, 张金峰, 邢梦怡. 基于跨模态交叉注意力网络的多模态情感分析方法[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 84 -93 .
[9] 王卫舵, 王以松, 杨磊. 云资源调度的回答集程序描述性求解[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 94 -104 .
[10] 龙芳, 蔡静, 朱艳. 逐步Ⅱ型混合截尾下Lomax分布多部件应力强度模型的可靠性分析[J]. 广西师范大学学报(自然科学版), 2024, 42(2): 120 -130 .
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发