广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (1): 161-164.

• • 上一篇    下一篇

基于语义理解的Bayesian-Boosting情感分类

沈剑平, 王轩, 于成龙, 李鑫鑫   

  1. 哈尔滨工业大学深圳研究生院计算机应用研究中心,广东深圳 518055
  • 收稿日期:2009-12-20 出版日期:2010-03-20 发布日期:2023-02-07
  • 通讯作者: 王轩(1969—),男,黑龙江哈尔滨人,哈尔滨工业大学教授,博士生导师。E-mail:wangxuan@insun.hit.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(60435020,90612005);国家863计划资助项目(2007AA01Z194)

Bayesian-Boosting Sentiment Classification Algorithm Based on Semantic

SHEN Jian-ping1, WANG Xuan1, YU Cheng-long1, LI Xin-xin1   

  1. Computer Application Research Center,Shenzhen Graduate School,Harbin Institute of Technology, Shenzhen Guangdong 518055,China
  • Received:2009-12-20 Online:2010-03-20 Published:2023-02-07

摘要: 提出将语义理解与统计学方法相结合的机器学习算法来进行文本情感分类。首先提取文本中的情感词汇作为特征,利用统计学方法得到特征的初始权重,然后通过分析文本语义结构修改特征权重,最后利用Bayesian算法和以Bayesian作为基本分类算法的Boosting算法进行分类。实验表明,基于语义理解的Bayesian分类算法的分类准确率高于仅基于统计学的Bayesian分类算法,基于语义理解的Bayesian-Boosting算法的分类准确率最高,达到了90%。

关键词: 语义理解, Bayesian, Boosting, 情感分类

Abstract: This paper presents a machine learning algorithm which combines the semantic and statistical aspect fortext sentiment classification.First,extract the text of the emotional wordsas features,and use the statistical methods to get the initial weight,then re-weight the feature by analyzing the semantic structure of the text;finally use Bayesian algorithms and Bayesian classification algorithm as a basic classification of the Boosting algorithm to classify the text.The empirical resultsshow that,the accuracy of the Bayesian classification algorithm based on semantic understanding is higher than the Bayesian classification algorithm based on statistic and its accuracy can reach 90%.

Key words: semantic orientation, Bayesian, Boosting, sentimentclassification

中图分类号: 

  • TP391.1
[1] TURNEY P D,LITTMAN M L.Measuring praise and criticism:inference ofsemantic orientation from association[J].ACM Transactions on Information Systems,2003,21(4):315-346.
[2] TSOU B K Y,YUEN R W M,KWONG O Y,et al.Polarity classification ofcelebrity coverage in the Chinese press[C/OL]//Proceeding of the International Conference on Intelligence Analysis.McLean VA,2-6 May,2005[2009-11-15].https://analysis.mitre.org/proceedings/FinalPapersFiles/109CameraReadyPaper.pdf.
[3] 金聪,金平.网络环境下中文情感倾向的分类方法[J].语言文字应用,2008,2(2):139-144.
[4] PANG Bo,LEE L,VAITHYANATHAN S.Thumbs up?Sentiment classification using machine learning techniques[C]//Proceedings of the ACL-02 Conference onEmpirical Methods in Natural Language Processing.Morristown,NJ:Association for Computational Linguistics,2002:79-86.
[5] WILSON T,WIEBE J,HWA R.Just how mad are you?Finding strong andweak opinion clauses[C]//Proceedings of the 19 th National Conference on Artificial Intelligence.Menlo Park,CA:AAAI Press,2004:761-767.
[6] LIU Bing.Web data mining:exploring hyperlinks,contents,and usage data[M].Berlin:Springer,2007:85.
[7] FREUND Y,SEHAPIRE R E.Experiments with a new Boosting algorithm[C]//Proceedings of the Thirteenth International Conference on Machine Learning.San Fransisco,CA:Morgan Kaufmann Publishers Inc,1996:148-156.
[8] 李广群.基于AdaBoost的限制性贝叶斯组合分类器研究[D].北京:北京交通大学计算机与信息技术学院,2007:13.
[9] 付彬,王志海,王中锋.Boosting算法中基分类器权重的动态赋值[J].广西师范大学学报:自然科学版,2009,27(3):85-88.
[10] 于玲,吴铁军.集成学习:Boosting算法综述[J].模式识别与人工智能,2004,17(1):52-59.
[11] 游春晖.基于语义情感倾向的文本相似度计算[D].成都:电子科技大学计算机学院,2008:39-41.
[12] 熊德兰.中文网页褒贬倾向性分类研究[D].郑州:郑州大学信息工程学院,2006:44-45.
[1] 马先兵, 孙水发, 覃音诗, 郭青, 夏平. 基于粒子滤波的on-line boosting目标跟踪算法[J]. 广西师范大学学报(自然科学版), 2013, 31(3): 100-105.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 陈永淇, 白克钊, 邝华, 孔令江, 刘慕仁. 教室内布局对人员疏散影响的研究[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 1 -4 .
[2] 许伦辉, 叶凡. 基于横、轴、竖加速度干扰模型的行车舒适性评价[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 5 -9 .
[3] 阳丽, 孔令江. 微纳米球形颗粒之间的毛细力研究[J]. 广西师范大学学报(自然科学版), 2012, 30(1): 1 -4 .
[4] 贺青, 刘剑, 韦联福. 微弱电磁信号的物理极限检测:单光子探测器及其研究进展[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 1 -23 .
[5] 白克钊, 罗旭东, 孔令江, 刘慕仁. 开放边界条件下一种数据传输元胞自动机模型[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 1 -4 .
[6] 许伦辉, 廖燃火昆. 基于车流轨迹的交叉口相位相序优化[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 5 -9 .
[7] 王修信, 秦丽梅, 农京辉, 梁宗经, 朱启疆. 利用单窗算法反演喀斯特城市地表温度[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 10 -14 .
[8] 黎玉芳, 张军舰. NA样本回归函数估计的强相合性[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 15 -19 .
[9] 贾保华. 一个不满足中心极限定理的严平稳相伴随机序列[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 20 -23 .
[10] 陈翠玲, 李明, 梁家梅, 李略. Wolfe线搜索下一类新的共轭梯度法及其收敛性[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 24 -28 .
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发