广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (3): 109-112.

• • 上一篇    下一篇

一种基于经验的分类方法探讨与应用

朱代辉, 陈光鹏, 杨育彬   

  1. 南京大学计算机软件新技术国家重点实验室,江苏南京210093
  • 收稿日期:2010-05-13 出版日期:2010-09-20 发布日期:2023-02-06
  • 通讯作者: 杨育彬(1977—),男,江西新干人,南京大学副教授,博士。E-mail:yangyubin@nju.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(60875011,60723003,60721002)

Research and Application of Experience-based Classification Method

ZHU Dai-hui, CHEN Guang-peng, YANG Yu-bin   

  1. State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing Jiangsu 210093,China
  • Received:2010-05-13 Online:2010-09-20 Published:2023-02-06

摘要: 基于已有的数据挖掘预测任务,探讨怎样对小样本的高维(万维以上)数据集进行降维、分类,并在此基础上提出基于物理受力模型的建模思想,同时给出一种易于实现的基于经验的折中分类方法。最后详述该方法在解决所给问题上的应用。

关键词: 维度灾难, 分类, 超配, 支持向量机

Abstract: With the brief introduction of predictive data miningtask,this paper discusses how to reduce the high dimensionality of data samples and classify the dataset correctly,which has very few samples but large amounts of features or variables.Afterwards,this paper proposes a novel classifier based on the above discussion,which is easily implemented.Finally,the application of the proposed classifier is discussed.

Key words: curse of dimensionality, classification, overfitting, SVM

中图分类号: 

  • TP301.6
[1] JIE Cheng,CHRISTOS H,HISASHI H,et al.KDD cup 2001[R].[S.l.]:ACM SIGKDD Explorations Newsletter,2002,3(2):47-64.
[2] PAGE D.KDD cup 2001[EB/OL].(2001-09-19).http://pages.cs.wisc.edu/~dpage/kddcup2001/.
[3] DAI J J,LIEU L,ROCKE D.Dimension reduction for classification withgene expression microarray data[J].Statistical Applications in Genetics and Molecular Biology,2006,5(1):6.
[4] GUYON L,ELISSEEFF A.An introduction to variable and feature selection[J].Journal of Machine Learning Research,2003,3:1157-1182.
[5] DAVID H,HEIKKI H,PADHRAIC S.Principles of data mining[M].Massachusetts:MIT Press,2001:213-214.
[6] 彭敏晶.可变惩罚系数比例的分类SVM模型[J].广西师范大学学报:自然科学版,2008,26(3):118.
[7] HAN Jia-wei,KAMBER M.Data mining:concepts and techniques[M].2nded.Massachusetts:Morgan Kaufmann Publishers,2006:337-344.
[1] 张涛, 杜建民. 基于无人机遥感的荒漠草原微斑块识别研究[J]. 广西师范大学学报(自然科学版), 2022, 40(6): 50-58.
[2] 张师超, 李佳烨. 知识矩阵表示[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 36-48.
[3] 陆相宜, 边迅, 邓维安. 几何形态测量学及其在直翅目研究中的应用[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 342-353.
[4] 陈知明, 张江, 邱汉清, 戴颖成, 吴宇鑫, 李建军. 基于密集连接的高分辨率遥感图像分类[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 88-94.
[5] 白德发, 徐欣, 王国长. 函数型数据广义线性模型和分类问题综述[J]. 广西师范大学学报(自然科学版), 2022, 40(1): 15-29.
[6] 杨迪, 方扬鑫, 周彦. 基于MEB和SVM方法的新类别分类研究[J]. 广西师范大学学报(自然科学版), 2022, 40(1): 57-67.
[7] 邓文轩, 杨航, 靳婷. 基于注意力机制的图像分类降维方法[J]. 广西师范大学学报(自然科学版), 2021, 39(2): 32-40.
[8] 薛涛, 丘森辉, 陆豪, 秦兴盛. 基于经验模态分解和多分支LSTM网络汇率预测[J]. 广西师范大学学报(自然科学版), 2021, 39(2): 41-50.
[9] 骆春璇, 梁翠君, 陈志林. 中国新纪录属种岩支蚁Cladomyrma scopulosa Eguchi & Bui(膜翅目:蚁科)记述[J]. 广西师范大学学报(自然科学版), 2021, 39(1): 98-101.
[10] 王俊杰, 温雪岩, 徐克生, 于鸣. 基于局部敏感哈希的改进堆叠算法[J]. 广西师范大学学报(自然科学版), 2020, 38(4): 21-31.
[11] 陈会明, 蒋玄空, 杨自忠. 中国大疣蛛属Macrothele两新种记述(蜘蛛目:大疣蛛科)[J]. 广西师范大学学报(自然科学版), 2020, 38(1): 114-119.
[12] 吴昊, 秦立春, 罗柳容. 基于提升度的KNN分类子的分类原则改良模型[J]. 广西师范大学学报(自然科学版), 2019, 37(2): 75-81.
[13] 朱勇建, 彭柯, 漆广文, 夏海英, 宋树祥. 基于机器视觉的太阳能网版缺陷检测[J]. 广西师范大学学报(自然科学版), 2019, 37(2): 105-112.
[14] 吕凯晨, 闫宏飞, 陈翀. 基于沪深300成分股的量化投资策略研究[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 1-12.
[15] 岳天驰, 张绍武, 杨亮, 林鸿飞, 于凯. 基于两阶段注意力机制的立场检测方法[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 42-49.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发