广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (4): 38-41.

• • 上一篇    下一篇

一种基于成对约束的谱聚类算法

张力文1, 丁世飞1,2, 许新征1, 朱红1, 徐丽1   

  1. 1.中国矿业大学 计算机科学与技术学院,江苏 徐州 221116;
    2.中国科学院计算技术研究所 智能信息处理重点实验室,北京 100080
  • 收稿日期:2010-07-25 发布日期:2023-02-07
  • 通讯作者: 丁世飞(1963—),男,山东青岛人,中国矿业大学教授,博士,博导。E-mail:dingsf@cumt.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(60975039);江苏省基础研究计划资助项目(BK2009093)

Semi-Supervised Spectral Clustering Algorithms Based on Pair Wise Constraints

ZHANG Li-wen1, DING Shi-fei1,2, XU Xin-zheng1, ZHU Hong1, XU Li1   

  1. 1.School of Computer Science and Technology,China University of Mining and Technology,Xuzhou Jiangsu 22116, China;
    2.Key Laboratory of Intelligent Information Processing,Institute ofComputing Technology,Chinese Academy of Sciences,Beijing 100080,China
  • Received:2010-07-25 Published:2023-02-07

摘要: 聚类通常被认为是一种无监督的数据分析方法,在聚类搜索过程中充分利用先验信息会显著提高聚类算法的性能。本文通过成对约束来调整点与点之间的相似矩阵,然后对其优化,并结合谱聚类算法,得到一种很有效的聚类算法——基于成对约束的半监督谱聚类算法(SSCA)。实验表明,该算法有很好的聚类效果。

关键词: 谱聚类, 先验信息, 成对约束, 半监督聚类

Abstract: Clustering has been traditionally viewed as an unsupervised method.Inreal world applications,it has been demonstrated that constraints can improve clustering performance.In this paper,a new semi-supervised spectral clusteringmethod based on pairwise constraints is proposed.The similar matrix is adjusted by the pairwise constraints,and then optimized.Combined with spectral clustering,an effective clustering algorithm can be obtained.The experiment shows thatthe algorithm has good clustering effect.

Key words: spectral clustering, prior knowledge, pair wise constraints, semi-supervised clustering

中图分类号: 

  • TP301.6
[1] 蔡晓妍,戴冠中,杨黎斌.谱聚类算法综述[J].计算机科学,2008,35(7):14-18.
[2] DING Shi-fei,ZHANG Li-wen,ZHANG Yu.Research on spectral clustering algorithms and prospects[C]//2010 the 2nd International Conference on Computer Engineering and Technology:Volume 6.New York:IEEE Press,2010:149-153.
[3] HAN Jia-wei,KAMBER M.数据挖掘概念与技术[M].北京:机械工业出版社,2006:251-305.
[4] 肖宇,于剑.基于近邻传播算法的半监督聚类[J].软件学报,2008,19(11):2803-2813.
[5] 王玲,薄列峰,焦李成.密度敏感的半监督谱聚类[J].软件学报,2007,18(10):2412-2422.
[6] 王娜,李霞.基于监督信息特性的主动半监督谱聚类算法[J].电子学报,2010,38(1):172-176.
[7] 高琰,古士文,唐王进.机器学习中谱聚类方法的研究[J].计算机科学,2007,34(2):201-203.
[8] WASTAFF K,CARDIE C.Clustering with instance-level constraints[C]//LANGLEYP.Proceedings of the 17th International Conference on Machine Learning.San Fransisco,CA:Morgan Kaufmann Publishers,2000:1103-1110.
[9] 孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008,19(1):48-61.
[10] WANG Chong-jun,LI Wu-jun,DING Lin,et al.Image segmentation using spectral clustering[C]//Proceedings of the 17th IEEE International Conference on Tools with Artificial Intelligence.Washington,DC:IEEE Computer Society,2005:677-678.
[1] 翁烨, 邵德盛, 甘淑. 等式约束病态最小二乘的主成分Liu估计解法[J]. 广西师范大学学报(自然科学版), 2022, 40(4): 115-125.
[2] 杨洋, 王立宏. 半监督聚类中成对约束的主动学习[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 87-91.
[3] 黎佳, 王明文, 何世柱, 柯丽. 基于特征加权的半监督聚类研究[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 92-97.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 陈永淇, 白克钊, 邝华, 孔令江, 刘慕仁. 教室内布局对人员疏散影响的研究[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 1 -4 .
[2] 许伦辉, 叶凡. 基于横、轴、竖加速度干扰模型的行车舒适性评价[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 5 -9 .
[3] 阳丽, 孔令江. 微纳米球形颗粒之间的毛细力研究[J]. 广西师范大学学报(自然科学版), 2012, 30(1): 1 -4 .
[4] 贺青, 刘剑, 韦联福. 微弱电磁信号的物理极限检测:单光子探测器及其研究进展[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 1 -23 .
[5] 白克钊, 罗旭东, 孔令江, 刘慕仁. 开放边界条件下一种数据传输元胞自动机模型[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 1 -4 .
[6] 许伦辉, 廖燃火昆. 基于车流轨迹的交叉口相位相序优化[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 5 -9 .
[7] 王修信, 秦丽梅, 农京辉, 梁宗经, 朱启疆. 利用单窗算法反演喀斯特城市地表温度[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 10 -14 .
[8] 黎玉芳, 张军舰. NA样本回归函数估计的强相合性[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 15 -19 .
[9] 贾保华. 一个不满足中心极限定理的严平稳相伴随机序列[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 20 -23 .
[10] 陈翠玲, 李明, 梁家梅, 李略. Wolfe线搜索下一类新的共轭梯度法及其收敛性[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 24 -28 .
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发