|
广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (1): 147-152.
袁野1, 封化民1,2
YUAN Ye1, FENG Hua-min1,2
摘要: 随着网络普及应用,Web内容安全问题已经引起人们的高度重视,对Web内容安全的分类监控已成为研究热点。在分析Web内容安全问题的基础上,提出一种“需求模型”,该模型结合向量空间模型(VSM),利用Vague集改进的特征提取策略,扩充原有文档特征表示模型。通过对来自真实网络网页中等规模的语料实验证明,这种“需求模型”可以提高网页内容安全的文本分类效果,分类效果优于采用传统特征的方法。
中图分类号:
[1] 呼声波,刘希玉.网页分类中特征提取方法的比较与改进[J].山东师范大学学报:自然科学版,2008,23(3):35-38. [2] GAU W L,BUEHRER D J.Vague sets[J].IEEE Transactions on Systems,Man and Cybernetics,1993,23(2):610-614. [3] HAO Yan-you,CHI Zhong-xian,YAN De-qin.Fuzzy support vector machine based on vague sets for credit assessment[C]//Proceedings of the Fourth International Conference on Fuzzy Systems and Knowledge Discovery.Washington DC:IEEE Computer Society,2007:603-607. [4] 裴振奎,徐九韵.Vague集之间相似度量的一种新方法[J].广西师范大学学报:自然科学版,2003,21(1):138-143. [5] 李凡,徐章艳.Vague集之间的相似度量[J].软件学报,2001,12(6):922-927. [6] 周晓光,谭春桥,张强.基于Vague集的决策理论与方法[M].北京:科学出版社,2009:38-39. [7] VAPNIK V N.The nature of statistical learning theory[J].New York:Springer-Verlag,1995:15. [8] THERSON J.Text categorization with support vector machines:learning with many relevant features[C]//European Conference on Machine Learning (ECML).Berlin:Springer,1998. [9] VAPNIK V N.统计学习理论的本质[M].张学工,译.北京:清华大学出版社,2000. [10] 张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. [11] 搜狗实验室.互联网语料库2006版[EB/OL].[2008-06-12].http://www.sogou.com/labs/. [12] 毋非,封化民.容错粗糙模型的事件检测研究[J].智能系统学报,2009,4(2):112-117. [13] BUCKLEY C,SALTON G,ALLAN J,et al.Automatic query expansion usingSMART:TREC 3[C]//Proceedings of the 3rd Text Retrieval Conference.GaithersburgM D:National Institute of Standards and Techonology,1994:69-80. [14] J SANG A,KNAPSKOG S J.A metric for trusted systems,Global IT Security[M].Wien:Austrian Computer Society,1998:541-549. [15] 哈工大信息检索研究室.语言技术平台共享包[EB/OL].[2008-06-12].http://ir.hit.edu.cn/. [16] 张博锋,苏金树,徐昕.一种新的多类SVM方法及其在文本分类中的应用[J].广西师范大学学报:自然科学版,2006,24(4):95-98. |
[1] | 朱绍宏, 覃章荣. 基于低代码开发范式的Web Service生成方法[J]. 广西师范大学学报(自然科学版), 2022, 40(6): 82-97. |
[2] | 岳天驰, 张绍武, 杨亮, 林鸿飞, 于凯. 基于两阶段注意力机制的立场检测方法[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 42-49. |
[3] | 何泉昊, 樊兴华, 周鹏. 基于两步策略的文本分类方法实验研究[J]. 广西师范大学学报(自然科学版), 2011, 29(4): 35-38. |
[4] | 廖海波, 万中英, 王明文. 免疫进化的投影寻踪模型在文本分类中的应用[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 123-128. |
[5] | 袁鼎荣, 谢扬才, 陆广泉, 刘星. 一种新的基于软集合理论的文本分类方法[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 129-132. |
[6] | 郭泗辉, 樊兴华. 一种改进的贝叶斯网络短文本分类算法[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 140-143. |
|
版权所有 © 广西师范大学学报(自然科学版)编辑部 地址:广西桂林市三里店育才路15号 邮编:541004 电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn 本系统由北京玛格泰克科技发展有限公司设计开发 |