|
广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (1): 161-164.
沈剑平, 王轩, 于成龙, 李鑫鑫
SHEN Jian-ping1, WANG Xuan1, YU Cheng-long1, LI Xin-xin1
摘要: 提出将语义理解与统计学方法相结合的机器学习算法来进行文本情感分类。首先提取文本中的情感词汇作为特征,利用统计学方法得到特征的初始权重,然后通过分析文本语义结构修改特征权重,最后利用Bayesian算法和以Bayesian作为基本分类算法的Boosting算法进行分类。实验表明,基于语义理解的Bayesian分类算法的分类准确率高于仅基于统计学的Bayesian分类算法,基于语义理解的Bayesian-Boosting算法的分类准确率最高,达到了90%。
中图分类号:
[1] TURNEY P D,LITTMAN M L.Measuring praise and criticism:inference ofsemantic orientation from association[J].ACM Transactions on Information Systems,2003,21(4):315-346. [2] TSOU B K Y,YUEN R W M,KWONG O Y,et al.Polarity classification ofcelebrity coverage in the Chinese press[C/OL]//Proceeding of the International Conference on Intelligence Analysis.McLean VA,2-6 May,2005[2009-11-15].https://analysis.mitre.org/proceedings/FinalPapersFiles/109CameraReadyPaper.pdf. [3] 金聪,金平.网络环境下中文情感倾向的分类方法[J].语言文字应用,2008,2(2):139-144. [4] PANG Bo,LEE L,VAITHYANATHAN S.Thumbs up?Sentiment classification using machine learning techniques[C]//Proceedings of the ACL-02 Conference onEmpirical Methods in Natural Language Processing.Morristown,NJ:Association for Computational Linguistics,2002:79-86. [5] WILSON T,WIEBE J,HWA R.Just how mad are you?Finding strong andweak opinion clauses[C]//Proceedings of the 19 th National Conference on Artificial Intelligence.Menlo Park,CA:AAAI Press,2004:761-767. [6] LIU Bing.Web data mining:exploring hyperlinks,contents,and usage data[M].Berlin:Springer,2007:85. [7] FREUND Y,SEHAPIRE R E.Experiments with a new Boosting algorithm[C]//Proceedings of the Thirteenth International Conference on Machine Learning.San Fransisco,CA:Morgan Kaufmann Publishers Inc,1996:148-156. [8] 李广群.基于AdaBoost的限制性贝叶斯组合分类器研究[D].北京:北京交通大学计算机与信息技术学院,2007:13. [9] 付彬,王志海,王中锋.Boosting算法中基分类器权重的动态赋值[J].广西师范大学学报:自然科学版,2009,27(3):85-88. [10] 于玲,吴铁军.集成学习:Boosting算法综述[J].模式识别与人工智能,2004,17(1):52-59. [11] 游春晖.基于语义情感倾向的文本相似度计算[D].成都:电子科技大学计算机学院,2008:39-41. [12] 熊德兰.中文网页褒贬倾向性分类研究[D].郑州:郑州大学信息工程学院,2006:44-45. |
[1] | 马先兵, 孙水发, 覃音诗, 郭青, 夏平. 基于粒子滤波的on-line boosting目标跟踪算法[J]. 广西师范大学学报(自然科学版), 2013, 31(3): 100-105. |
|
版权所有 © 广西师范大学学报(自然科学版)编辑部 地址:广西桂林市三里店育才路15号 邮编:541004 电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn 本系统由北京玛格泰克科技发展有限公司设计开发 |