广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (1): 147-152.

• • 上一篇    下一篇

基于Vague集的Web内容安全文本分类

袁野1, 封化民1,2   

  1. 1.西安电子科技大学通信工程学院,陕西西安 710071;
    2.北京电子科技学院,北京 100070
  • 收稿日期:2010-01-10 出版日期:2010-03-20 发布日期:2023-02-07
  • 通讯作者: 封化民(1963—),男,陕西富平人,北京电子科技学院教授,博士。E-mail:fenghm@besti.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(60972139);北京市自然科学基金资助项目(4062031,4092041)

Web Content Security Textual Classification Based on Vague Set

YUAN Ye1, FENG Hua-min1,2   

  1. 1. School of Telecommunication Engineering,Xidian University,Xi'an Shaanxi 710071,China;
    2. Beijing Electronic Science and Technology Institute,Beijing 100070,China
  • Received:2010-01-10 Online:2010-03-20 Published:2023-02-07

摘要: 随着网络普及应用,Web内容安全问题已经引起人们的高度重视,对Web内容安全的分类监控已成为研究热点。在分析Web内容安全问题的基础上,提出一种“需求模型”,该模型结合向量空间模型(VSM),利用Vague集改进的特征提取策略,扩充原有文档特征表示模型。通过对来自真实网络网页中等规模的语料实验证明,这种“需求模型”可以提高网页内容安全的文本分类效果,分类效果优于采用传统特征的方法。

关键词: 内容安全, 文本分类, 需求模型, Vague集

Abstract: With the popularity of Web applications,Web contentsecurity has beenaroused great attention.Web content security monitoring and classifying have become a key research issue.Based on the analysis of Web content security,demandedmodel is proposed in this paper.The model,combined with VSM,employs the Vagueset to improve the feature extraction strategy on the set of original documentrepresentation model.The results of the experiment on the medium-sized Web pages fromthe real Web corpus show that this model can improve the Web content security text classification results,compared with the traditional one.

Key words: content security, text classification, demand model, Vague set

中图分类号: 

  • TP391.1
[1] 呼声波,刘希玉.网页分类中特征提取方法的比较与改进[J].山东师范大学学报:自然科学版,2008,23(3):35-38.
[2] GAU W L,BUEHRER D J.Vague sets[J].IEEE Transactions on Systems,Man and Cybernetics,1993,23(2):610-614.
[3] HAO Yan-you,CHI Zhong-xian,YAN De-qin.Fuzzy support vector machine based on vague sets for credit assessment[C]//Proceedings of the Fourth International Conference on Fuzzy Systems and Knowledge Discovery.Washington DC:IEEE Computer Society,2007:603-607.
[4] 裴振奎,徐九韵.Vague集之间相似度量的一种新方法[J].广西师范大学学报:自然科学版,2003,21(1):138-143.
[5] 李凡,徐章艳.Vague集之间的相似度量[J].软件学报,2001,12(6):922-927.
[6] 周晓光,谭春桥,张强.基于Vague集的决策理论与方法[M].北京:科学出版社,2009:38-39.
[7] VAPNIK V N.The nature of statistical learning theory[J].New York:Springer-Verlag,1995:15.
[8] THERSON J.Text categorization with support vector machines:learning with many relevant features[C]//European Conference on Machine Learning (ECML).Berlin:Springer,1998.
[9] VAPNIK V N.统计学习理论的本质[M].张学工,译.北京:清华大学出版社,2000.
[10] 张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.
[11] 搜狗实验室.互联网语料库2006版[EB/OL].[2008-06-12].http://www.sogou.com/labs/.
[12] 毋非,封化民.容错粗糙模型的事件检测研究[J].智能系统学报,2009,4(2):112-117.
[13] BUCKLEY C,SALTON G,ALLAN J,et al.Automatic query expansion usingSMART:TREC 3[C]//Proceedings of the 3rd Text Retrieval Conference.GaithersburgM D:National Institute of Standards and Techonology,1994:69-80.
[14] J SANG A,KNAPSKOG S J.A metric for trusted systems,Global IT Security[M].Wien:Austrian Computer Society,1998:541-549.
[15] 哈工大信息检索研究室.语言技术平台共享包[EB/OL].[2008-06-12].http://ir.hit.edu.cn/.
[16] 张博锋,苏金树,徐昕.一种新的多类SVM方法及其在文本分类中的应用[J].广西师范大学学报:自然科学版,2006,24(4):95-98.
[1] 朱绍宏, 覃章荣. 基于低代码开发范式的Web Service生成方法[J]. 广西师范大学学报(自然科学版), 2022, 40(6): 82-97.
[2] 岳天驰, 张绍武, 杨亮, 林鸿飞, 于凯. 基于两阶段注意力机制的立场检测方法[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 42-49.
[3] 何泉昊, 樊兴华, 周鹏. 基于两步策略的文本分类方法实验研究[J]. 广西师范大学学报(自然科学版), 2011, 29(4): 35-38.
[4] 廖海波, 万中英, 王明文. 免疫进化的投影寻踪模型在文本分类中的应用[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 123-128.
[5] 袁鼎荣, 谢扬才, 陆广泉, 刘星. 一种新的基于软集合理论的文本分类方法[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 129-132.
[6] 郭泗辉, 樊兴华. 一种改进的贝叶斯网络短文本分类算法[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 140-143.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 陈永淇, 白克钊, 邝华, 孔令江, 刘慕仁. 教室内布局对人员疏散影响的研究[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 1 -4 .
[2] 许伦辉, 叶凡. 基于横、轴、竖加速度干扰模型的行车舒适性评价[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 5 -9 .
[3] 阳丽, 孔令江. 微纳米球形颗粒之间的毛细力研究[J]. 广西师范大学学报(自然科学版), 2012, 30(1): 1 -4 .
[4] 贺青, 刘剑, 韦联福. 微弱电磁信号的物理极限检测:单光子探测器及其研究进展[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 1 -23 .
[5] 白克钊, 罗旭东, 孔令江, 刘慕仁. 开放边界条件下一种数据传输元胞自动机模型[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 1 -4 .
[6] 许伦辉, 廖燃火昆. 基于车流轨迹的交叉口相位相序优化[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 5 -9 .
[7] 王修信, 秦丽梅, 农京辉, 梁宗经, 朱启疆. 利用单窗算法反演喀斯特城市地表温度[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 10 -14 .
[8] 黎玉芳, 张军舰. NA样本回归函数估计的强相合性[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 15 -19 .
[9] 贾保华. 一个不满足中心极限定理的严平稳相伴随机序列[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 20 -23 .
[10] 陈翠玲, 李明, 梁家梅, 李略. Wolfe线搜索下一类新的共轭梯度法及其收敛性[J]. 广西师范大学学报(自然科学版), 2010, 28(3): 24 -28 .
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发