|
广西师范大学学报(自然科学版) ›› 2012, Vol. 30 ›› Issue (1): 45-49.
陆广泉, 谢扬才, 刘星, 张师超
LU Guang-quan, XIE Yang-cai, LIU Xing, ZHANG Shi-chao
摘要: 本文提出一种新的基于KNN分类的半监督学习self-training改进算法,并以多个UCI数据集为实验,对基于KNN的半监督分类模型算法进行改进,充分利用已知类别标签数据的正确知识进行自训练,以得到最终分类结果。实验结果表明,该方法能显著提高分类准确率。
中图分类号:
[1] CHAPELLE O,SCHOLKOPF B,ZIEN.A semi-supervised learning[M].Cambridge:MIT Press,2006:12-27. [2] 许震,沙朝锋,王晓玲,等.基于KL距离的非平衡数据半监督学习算法[J].计算机研究与发展,2010,47(1):81-87. [3] 陆伟宙,余顺争.基于半监督聚类的Web流量分类[J].计算机科学,2009,36(2):90-94. [4] 缪志敏,赵陆文,胡谷雨,等.基于单类分类器的半监督学习[J].模式识别与人工智能,2009,22(6):924-930. [5] 赵涛涛,洪宇,华震威,等.基于Tri-training算法的中文短语翻译自由度计算[J].广西师范大学学报:自然科学版,2010,28(3):122-125. [6] 朱美琳,杨佩.半监督支持向量机的多分类学习算法[J].郑州大学学报:理学版,2008,40(4):35-38. [7] MILLER D J,UYAR H S.A mixture of experts classifier with learningbased on both labelled and unlabelled data[C]//MOZER M,JORDAN M I,PETSCHE T,etal.Advances in Neural Information Processing Systems 9.Cambridge:MIT Press,1997:571-577. [8] PEDRYCZ W,WALETZKY J.Fuzzy clustering with partial supervision[J].IEEE Transaction on Systems,Man,and Cybernetics:Part B,1997,27(5):787-795. [9] ZHU Xiao-jin.Semi-supervised learning literature survey:TR 1530[R/OL].Madison,WI:Department of Computer Science,University of Wisconsin,2008[2011-10-28].http://pages.cs.wisc.edu/~jerryzhu/pub/sslsurvey.pdf. [10] KULIS B,BASU S,DHILLON I,et al.Semi-supervised graph clustering:a kernel approach[J].Machine Learing,2009,74(1):1-22. [11] ZHU Xiao-jin,GOLDBERG A B.Introduction to semi-supervised learning[M].San Rafael,CA:Morgan and Claypool Publishers,2009:9-19. [12] ZHOU Zhi-hua,LI Ming.Tri-training:exploiting unlabeled data using three classifiers[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(11):1529-1541. |
[1] | 白捷, 高海力, 王永众, 杨来邦, 项晓航, 楼雄伟. 基于多路特征融合的Faster R-CNN与迁移学习的学生课堂行为检测[J]. 广西师范大学学报(自然科学版), 2020, 38(5): 1-11. |
[2] | 吴昊, 秦立春, 罗柳容. 基于提升度的KNN分类子的分类原则改良模型[J]. 广西师范大学学报(自然科学版), 2019, 37(2): 75-81. |
[3] | 林越, 刘廷章, 王哲河. 具有两类上限条件的虚拟样本生成数量优化[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 142-148. |
[4] | 郑威,文国秋,何威,胡荣耀,赵树之. 属性自表达的低秩无监督属性选择算法[J]. 广西师范大学学报(自然科学版), 2018, 36(1): 61-69. |
[5] | 宗鸣, 龚永红, 文国秋, 程德波, 朱永华. 基于稀疏学习的kNN分类[J]. 广西师范大学学报(自然科学版), 2016, 34(3): 39-45. |
[6] | 苏毅娟, 孙可, 邓振云, 尹科军. 基于LPP和l2,1的KNN填充算法[J]. 广西师范大学学报(自然科学版), 2015, 33(4): 55-62. |
[7] | 雷霖, 罗小勇. 一种新的量子进化算法实数编码方式及应用[J]. 广西师范大学学报(自然科学版), 2013, 31(4): 23-27. |
[8] | 刘海峰, 续欣莹, 申雪芬, 谢王君. 基于限制邻域关系的不完备混合决策系统属性约简[J]. 广西师范大学学报(自然科学版), 2013, 31(3): 30-36. |
[9] | 申雪芬, 谢王君, 刘海峰, 续欣莹. 一种改进的基于相对正域的增量式属性约简算法[J]. 广西师范大学学报(自然科学版), 2013, 31(3): 45-50. |
[10] | 胡卉颖, 钟智, 元昌安, 陆建波, 袁晖. 基于基因表达式编程的粗糙集属性约简研究[J]. 广西师范大学学报(自然科学版), 2012, 30(2): 23-28. |
[11] | 高俊芬, 胡维平. 基于非线性动力学和GMM的病态嗓音识别与研究[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 5-8. |
[12] | 徐丽, 丁世飞, 郭锋锋. 基于改进属性约简的粗核聚类算法[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 105-109. |
[13] | 黄霜明, 谢丽聪. 协同训练半监督学习二次伪迭代算法[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 110-114. |
[14] | 丁磊, 王浩, 方宝富, 张权益. 基于Fast Marching方法的多机器人追捕算法[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 115-119. |
[15] | 孟凡辉, 王浩, 方宝富, 彭伟. 可扩展梯度直方图人体检测算法研究与实现[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 168-172. |
|
版权所有 © 广西师范大学学报(自然科学版)编辑部 地址:广西桂林市三里店育才路15号 邮编:541004 电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn 本系统由北京玛格泰克科技发展有限公司设计开发 |