|
广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (1): 72-76.
张师超, 朱曼龙, 黄木梁昌
ZHANG Shi-chao, ZHU Man-long, HUANG Liang-chang
摘要: 针对k最近邻填充算法(kNNI)在缺失数据的k个最近邻的选择上可能存在偏好,提出一种新的缺失填充算法:象限近邻填充算法QENNI(quadrant-encapsidated-nearest-neighbor-based imputation),它仅仅使用缺失数据象限方向的最近邻数据填充该缺失值,避免了kNNI中选取的k个最近邻点有偏好这一情况。另外,此算法对于低维数据集可以是无参的,即消除了对参数的依赖。实验结果表明,QENNI算法的填充准确性要优于kNNI算法。
中图分类号:
[1] ZHANG Shi-chao.Parimputation:from imputation and null-imputation to partially imputation[J].IEEE Intelligent Informatics Bulletin,2008,9(1):32-38. [2] ZHANG Shi-chao.Shell-neighbor method and its application in missing data imputation[J].Applied Intelligence,2010(待发). [3] QIN Yong-song,ZHANG Shi-chao,ZHU Xiao-feng,et al.Semi-parametric optimization for missing data imputation[J].Applied Intelligence,2007,27(1):79-88. [4] BATISTA G,MONARD M C.An analysis of four missing data treatment methods for supervised learning[J].Applied Artificial Intelligence,2003,17(5):519-533. [5] GEDIGA G,DUNTSCH I.Maximum consistency of incomplete data via non-invasive imputation[J].Artificial Intelligence Review,2003,19(1):93-107. [6] WANG Qi-hua,RAO J N K.Empirical likelihood-based inference underimputation for missing response data[J].The Annals of Statistics,2002,30(3):896-924. [7] BATISTA G E,MONARD M C.A study of k-nearest neighbor as a model-based method to treat missing data[C]//Proceedings of the Argentine Symposium on Artificial Intelligence.Bering Germany:Springer,2001,30:1-9. [8] 金自翔,戴新宇,陈家骏.一种基于贪婪算法的KNN参数选择策略[J].广西师范大学学报:自然科学版,2008,26(1):182-185. [9] 朱晓锋.缺失值填充若干问题研究[D].桂林:广西师范大学计算机科学与信息工程学院,2007. |
[1] | 苏毅娟, 孙可, 邓振云, 尹科军. 基于LPP和l2,1的KNN填充算法[J]. 广西师范大学学报(自然科学版), 2015, 33(4): 55-62. |
|
版权所有 © 广西师范大学学报(自然科学版)编辑部 地址:广西桂林市三里店育才路15号 邮编:541004 电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn 本系统由北京玛格泰克科技发展有限公司设计开发 |