广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (3): 140-143.

• • 上一篇    下一篇

一种改进的贝叶斯网络短文本分类算法

郭泗辉, 樊兴华   

  1. 重庆邮电大学计算机科学与技术研究所,重庆400065
  • 收稿日期:2010-05-31 出版日期:2010-09-20 发布日期:2023-02-06
  • 通讯作者: 樊兴华(1972—),男,重庆人,重庆邮电大学教授,博士。E-mail:fanxh@cqupt.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(60703010);重庆市自然科学基金资助项目(CSTC2009BB2079)

An Improved Short Text Classification Algorithm Based on Bayesian Network

GUO Si-hui, FAN Xing-hua   

  1. Institute of Computer Science and Technology,Chongqing University of Posts and Telecommunications, Chongqing 400065,China
  • Received:2010-05-31 Online:2010-09-20 Published:2023-02-06

摘要: 对于短文本由于其特征数少而使分类效果不理想的情况,提出一种改进的贝叶斯网络文本分类算法,改进之处在于贝叶斯网络结构学习阶段寻找父节点的步骤,算法在考虑了连接强度的因素后,减少了本来不相关的两个节点被归类为父子关系的错误干扰,使每个节点找到的父节点更加准确,从而使文本的分类准确度得到了提升。

关键词: 贝叶斯网络, 连接强度, 短文本分类

Abstract: Due to the fact that inadequate features of short text makes unsatisfactory classification,an improved algorithm fortext classification based on Bayesian network is presented.The improvement liesin the steps of Bayesian networkstructure learning phase for finding parent node.The algorithm takes into account the connection strength of the factors,thus,a decrease of interference errors between two nodes that are unrelated to the father and son nodes is achieved.It enables each node to find more accurate father node,and improves the classification accuracy of text.

Key words: Bayesian network, connection strength, short text classification

中图分类号: 

  • TP391.4
[1] 薛德军.中文文本自动分类中的关键问题研究[D].北京:清华大学计算机科学与技术系,2004:2-3.
[2] SEBASTIANI F.Machine learning in automated text categorization[J].ACM Computing Surveys,2002,34(1):1-47.
[3] 王昊鹏,王卫东,李森.基于元数据的科技论文分类方法[J].山东师范大学学报:自然科学版,2008,23(3):41-43.
[4] 冀俊忠,刘椿年,沙志强.贝叶斯网模型的学习、推理和应用[J].计算机工程与应用,2003(5):7-11.
[5] 胡卫华,朱永利.贝叶斯网络推理算法的研究和实现[J].华北电力大学学报,2004,31(5):63-65.
[6] SAHAMI M.Learning limited dependence Bayesian classifiers[C]//Proceedings of the Second International Conference on Knowledge Discovery and Data Mining.Menlo Park:AAAI Press,1996:335-338.
[7] 樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131.
[1] 牛学德, 高丙朋, 任荣荣, 徐明明. 基于轻量级CNN的作物病虫害识别及安卓端应用[J]. 广西师范大学学报(自然科学版), 2022, 40(6): 59-68.
[2] 于梦竹, 唐振军. 基于手工特征的视频哈希研究综述[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 72-89.
[3] 梁启花, 胡现韬, 钟必能, 于枫, 李先贤. 基于孪生网络的目标跟踪算法研究进展[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 90-103.
[4] 李志欣, 苏强. 基于知识辅助的图像描述生成[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 418-432.
[5] 万黎明, 张小乾, 刘知贵, 宋林, 周莹, 李理. 基于高效通道注意力的UNet肺结节CT图像分割[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 66-75.
[6] 张萍, 徐巧枝. 基于多感受野与分组混合注意力机制的肺结节分割研究[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 76-87.
[7] 李永杰, 周桂红, 刘博. 基于YOLOv3模型的人脸检测与头部姿态估计融合算法[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 95-103.
[8] 陈文康, 陆声链, 刘冰浩, 李帼, 刘晓宇, 陈明. 基于改进YOLOv4的果园柑橘检测方法研究[J]. 广西师范大学学报(自然科学版), 2021, 39(5): 134-146.
[9] 张伟彬, 吴军, 易见兵. 基于RFB网络的特征融合管制物品检测算法研究[J]. 广西师范大学学报(自然科学版), 2021, 39(4): 34-46.
[10] 邓文轩, 杨航, 靳婷. 基于注意力机制的图像分类降维方法[J]. 广西师范大学学报(自然科学版), 2021, 39(2): 32-40.
[11] 唐熔钗, 伍锡如. 基于改进YOLO-V3网络的百香果实时检测[J]. 广西师范大学学报(自然科学版), 2020, 38(6): 32-39.
[12] 张灿龙, 李燕茹, 李志欣, 王智文. 基于核相关滤波与特征融合的分块跟踪算法[J]. 广西师范大学学报(自然科学版), 2020, 38(5): 12-23.
[13] 肖逸群, 宋树祥, 夏海英. 基于多特征的快速行人检测方法及实现[J]. 广西师范大学学报(自然科学版), 2019, 37(4): 61-67.
[14] 王勋, 李廷会, 潘骁, 田宇. 基于改进模糊C均值聚类与Otsu的图像分割方法[J]. 广西师范大学学报(自然科学版), 2019, 37(4): 68-73.
[15] 孙妤喆, 卢磊, 罗晓曙, 郭磊, 郝占龙, 唐堂. 结合非局部均值滤波的双边滤波图像去噪方法[J]. 广西师范大学学报(自然科学版), 2017, 35(2): 32-38.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发