|
广西师范大学学报(自然科学版) ›› 2011, Vol. 29 ›› Issue (4): 35-38.
何泉昊, 樊兴华, 周鹏
HE Quan-hao, FAN Xing-hua, ZHOU Peng
摘要: 已知朴素贝叶斯分类器使用两步策略的分类方法提高了两类中文文本分类的效率,本文在此基础上,研究3个问题:①可以使用两步策略分类方法的分类器须满足的条件;②3种理论上可用两步策略进行文本分类的分类器;③实验比较Rocchio、朴素贝叶斯、KNN3种分类器两两组合后应用于多类英语文本分类的效果。实验结果表明:Rocchio、朴素贝叶斯、KNN3种分类器满足两步策略分类的条件,且当KNN作第一步分类器,朴素贝叶斯作第二步分类器时分类效果最好。
中图分类号:
[1] SEBASTIANI F.Machine Learning in automated text categorization[J].ACM Computing Surveys,2002,34(1):1-47. [2] 张玉芳,杨柯,熊忠阳.基于关联规则的中文文本分类算法的改进[J].郑州大学学报:理学版,2007,39(2):114-117. [3] 樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. [4] 樊兴华.因果推理和文本分类[R].北京:清华大学计算机科学与技术系,2004. [5] RCCHIO J J.Relevance feedback in information retrieval[C]//The SMART Retrieval System Experiments in Automatic Document Processing.Englewood Cliffs,NJ:Prentice Hall,1971:31323. [6] LEWIS D D.Naive bayes at forty:the independence as-sumption in information retrieval[C]//Proceedings of the 10th European Conference on Maching Learning:LNCS vol 1398.Berlin:Springer,1998:4-15. [7] 孙丽华,张积东,李静梅.一种改进的KNN方法及其在文本分类中的应用[J].应用科技,2002,29(2):25-27. [8] 陈建林,樊兴华,王国胤.基于两步策略的英文文本分类[J].广西师范大学学报:自然科学版,2007,25(4):200-203. |
[1] | 岳天驰, 张绍武, 杨亮, 林鸿飞, 于凯. 基于两阶段注意力机制的立场检测方法[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 42-49. |
[2] | 廖海波, 万中英, 王明文. 免疫进化的投影寻踪模型在文本分类中的应用[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 123-128. |
[3] | 袁鼎荣, 谢扬才, 陆广泉, 刘星. 一种新的基于软集合理论的文本分类方法[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 129-132. |
|
版权所有 © 广西师范大学学报(自然科学版)编辑部 地址:广西桂林市三里店育才路15号 邮编:541004 电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn 本系统由北京玛格泰克科技发展有限公司设计开发 |