广西师范大学学报(自然科学版) ›› 2012, Vol. 30 ›› Issue (1): 45-49.

• • 上一篇    下一篇

一种基于KNN的半监督分类改进算法

陆广泉, 谢扬才, 刘星, 张师超   

  1. 广西师范大学计算机科学与信息工程学院,广西桂林541004
  • 收稿日期:2011-09-16 出版日期:2012-01-20 发布日期:2018-12-03
  • 通讯作者: 张师超(1962—),男,广西桂林人,广西师范大学教授,博士。E-mail:zhangsc@mailbox.gxnu.edu.cn
  • 基金资助:
    国家863计划项目(2012AA011005)

An Improvement Semi-supervised Learning Based on KNN Classification

LU Guang-quan, XIE Yang-cai, LIU Xing, ZHANG Shi-chao   

  1. College of Computer Science and Information Technology,GuangxiNormal University,Guilin Guangxi 541004,China
  • Received:2011-09-16 Online:2012-01-20 Published:2018-12-03

摘要: 本文提出一种新的基于KNN分类的半监督学习self-training改进算法,并以多个UCI数据集为实验,对基于KNN的半监督分类模型算法进行改进,充分利用已知类别标签数据的正确知识进行自训练,以得到最终分类结果。实验结果表明,该方法能显著提高分类准确率。

关键词: 半监督学习, KNN分类器, 自训练

Abstract: An improved semi-supervised self-training classification learning algorithm is proposed based on K nearest neighbor,and several UCI data sets are used for experiments to improve the KNN-based semi-supervised classification model (self-training model) algorithm.The labeled datawhich gives the correct knowledge fromthe training is provided toget the final classification results.And the results show that the method can increase the classification accuracy dramatically.

Key words: semi-supervised learning, KNN classification, self-training

中图分类号: 

  • TP181
[1] CHAPELLE O,SCHOLKOPF B,ZIEN.A semi-supervised learning[M].Cambridge:MIT Press,2006:12-27.
[2] 许震,沙朝锋,王晓玲,等.基于KL距离的非平衡数据半监督学习算法[J].计算机研究与发展,2010,47(1):81-87.
[3] 陆伟宙,余顺争.基于半监督聚类的Web流量分类[J].计算机科学,2009,36(2):90-94.
[4] 缪志敏,赵陆文,胡谷雨,等.基于单类分类器的半监督学习[J].模式识别与人工智能,2009,22(6):924-930.
[5] 赵涛涛,洪宇,华震威,等.基于Tri-training算法的中文短语翻译自由度计算[J].广西师范大学学报:自然科学版,2010,28(3):122-125.
[6] 朱美琳,杨佩.半监督支持向量机的多分类学习算法[J].郑州大学学报:理学版,2008,40(4):35-38.
[7] MILLER D J,UYAR H S.A mixture of experts classifier with learningbased on both labelled and unlabelled data[C]//MOZER M,JORDAN M I,PETSCHE T,etal.Advances in Neural Information Processing Systems 9.Cambridge:MIT Press,1997:571-577.
[8] PEDRYCZ W,WALETZKY J.Fuzzy clustering with partial supervision[J].IEEE Transaction on Systems,Man,and Cybernetics:Part B,1997,27(5):787-795.
[9] ZHU Xiao-jin.Semi-supervised learning literature survey:TR 1530[R/OL].Madison,WI:Department of Computer Science,University of Wisconsin,2008[2011-10-28].http://pages.cs.wisc.edu/~jerryzhu/pub/sslsurvey.pdf.
[10] KULIS B,BASU S,DHILLON I,et al.Semi-supervised graph clustering:a kernel approach[J].Machine Learing,2009,74(1):1-22.
[11] ZHU Xiao-jin,GOLDBERG A B.Introduction to semi-supervised learning[M].San Rafael,CA:Morgan and Claypool Publishers,2009:9-19.
[12] ZHOU Zhi-hua,LI Ming.Tri-training:exploiting unlabeled data using three classifiers[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(11):1529-1541.
[1] 白捷, 高海力, 王永众, 杨来邦, 项晓航, 楼雄伟. 基于多路特征融合的Faster R-CNN与迁移学习的学生课堂行为检测[J]. 广西师范大学学报(自然科学版), 2020, 38(5): 1-11.
[2] 吴昊, 秦立春, 罗柳容. 基于提升度的KNN分类子的分类原则改良模型[J]. 广西师范大学学报(自然科学版), 2019, 37(2): 75-81.
[3] 林越, 刘廷章, 王哲河. 具有两类上限条件的虚拟样本生成数量优化[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 142-148.
[4] 郑威,文国秋,何威,胡荣耀,赵树之. 属性自表达的低秩无监督属性选择算法[J]. 广西师范大学学报(自然科学版), 2018, 36(1): 61-69.
[5] 宗鸣, 龚永红, 文国秋, 程德波, 朱永华. 基于稀疏学习的kNN分类[J]. 广西师范大学学报(自然科学版), 2016, 34(3): 39-45.
[6] 苏毅娟, 孙可, 邓振云, 尹科军. 基于LPP和l2,1的KNN填充算法[J]. 广西师范大学学报(自然科学版), 2015, 33(4): 55-62.
[7] 雷霖, 罗小勇. 一种新的量子进化算法实数编码方式及应用[J]. 广西师范大学学报(自然科学版), 2013, 31(4): 23-27.
[8] 刘海峰, 续欣莹, 申雪芬, 谢王君. 基于限制邻域关系的不完备混合决策系统属性约简[J]. 广西师范大学学报(自然科学版), 2013, 31(3): 30-36.
[9] 申雪芬, 谢王君, 刘海峰, 续欣莹. 一种改进的基于相对正域的增量式属性约简算法[J]. 广西师范大学学报(自然科学版), 2013, 31(3): 45-50.
[10] 胡卉颖, 钟智, 元昌安, 陆建波, 袁晖. 基于基因表达式编程的粗糙集属性约简研究[J]. 广西师范大学学报(自然科学版), 2012, 30(2): 23-28.
[11] 高俊芬, 胡维平. 基于非线性动力学和GMM的病态嗓音识别与研究[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 5-8.
[12] 徐丽, 丁世飞, 郭锋锋. 基于改进属性约简的粗核聚类算法[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 105-109.
[13] 黄霜明, 谢丽聪. 协同训练半监督学习二次伪迭代算法[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 110-114.
[14] 丁磊, 王浩, 方宝富, 张权益. 基于Fast Marching方法的多机器人追捕算法[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 115-119.
[15] 孟凡辉, 王浩, 方宝富, 彭伟. 可扩展梯度直方图人体检测算法研究与实现[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 168-172.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发