广西师范大学学报(自然科学版) ›› 2011, Vol. 29 ›› Issue (1): 151-156.

• • 上一篇    下一篇

基于组块分析的评价对象识别及其应用

杨亮, 潘凤鸣, 林鸿飞   

  1. 大连理工大学计算机科学与技术学院,辽宁大连116024
  • 收稿日期:2010-12-22 发布日期:2018-11-16
  • 通讯作者: 林鸿飞(1962—),男(满族),内蒙古通辽人,大连理工大学教授,博士。E-mail: hflin@dlut.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(60673039,60973068);国家社科基金资助项目(08BTQ025);国家863高科技计划资助项目(2006AA01Z151);教育部留学回国人员科研启动基金和高等学校博士学科点专项科研基金资助课题(20090041110002)

Chunk-based Opinion Object Extraction and Application in OpinionAnalysis

YANG Liang, PAN Feng-ming, LIN Hong-fei   

  1. College of Computer Science and Technology,Dalian University of Technology,Dalian Liaoning 116024,China
  • Received:2010-12-22 Published:2018-11-16

摘要: 观点挖掘技术旨在面向更为广阔的产品领域,从文本中自动获取观点所评价的对象,并有针对性地分析评论的倾向性。本文通过建立ChunkCRF模型对观点表达句中显式观点评价对象的识别;借助句法关系对句中出现多个评价对象的问题进行处理;利用语义搭配习惯对隐式评价对象进行填充生成。在此基础上,本文实现了基于观点评价对象的观点抽取与观点倾向性识别。实验结果表明,本文方法可有效地用于提高观点分析的精度。

关键词: ChunkCRF, 观点倾向性分析, 观点评价

Abstract: Opinion analysis based on opinion-object extractionaims at mining opinions from multi-field reviews.This technique analyzes opinion reviews by extracting opinion objects and grouping the opinion objects automatically.A ChunkCRF model is constructed to divide the opinionatedsentence into particular chunks which helps to identify the opinion objects andother opinion elements effectively.In the case of multi-objects in one sentence,syntactic structure is analyzed for a decision.In the case of implicit opinionobjects,opinion object is generated by a semantic method.On this basis,opinion analysis based on opinion-object extraction is practiced.

Key words: ChunkCRF, opinion analysis, opinion object extraction

中图分类号: 

  • TP391.1
[1] HU Min-qing,LIU Bing.Mining and summarizing customer reviews[C]//Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2004:168-177.
[2] WU Yuan-bin,ZHANG Qi,HUANG Xuan-jing.Phrase dependency parsingfor opinion mining[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP2009):Volume 3.New York:ACM,2009:1533-1541.
[3] GUO Hong-lei,ZHU Hui-jia,GUO Zhi-li.Product feature categorization with multilevel latent semantic association[C]//Proceeding of the 18th ACMConference on Information and Knowledge Management (CIKM2009).New York:ACM,2009:1087-1096.
[4] ZHUANG L,JING F,ZHU X Y.Movie review mining and summarization[C]//Proceeding of the 18th ACM Conference on Information and Knowledge Management(CIKM2006).New York:ACM,2006:43-50.
[5] 李俐莹.意见摘要方法之研究[D].台北:台湾大学自然语言处理实验室,2005.
[6] 徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100.
[7] ABNEY S.Parsing by chunks[M].ROBERT C B,STEVEN P A,CAROLL T,et al.Principle-Based Parsing:Computation and Psycholinguistics.Dordrecht:Kluwer Academic Publishers,1991:257-278.
[8] 刘芳,赵铁军,于浩,等.基于统计的汉语组块分析[J].中文信息学报,2000,14(6):28-32.
[9] ERIK F,TIONG K S,SABINE B.Introduction to the CoNLL-2000 shared task:chunking[C]//Proceedings of CoNLL-2000,New Branswich,NJ:Association forComputational Linguistics,2000:127-132.
[10] LAFFERTY J,McCALLUM A,PEREIRA F.Conditional random fields:probabilistic models for segmenting and labeling sequence data[C]//Proceedings of the18th International Conference on Machine Learning.San Francisco:Morgan Kaufmann,2001:282-289.
[11] 赵军,许洪波,黄萱菁,等.中文倾向性分析评测技术报告[C]//第一届中文倾向性分析研讨会.北京:[s.n.],2008:6-25.
[1] 王健, 郑七凡, 李超, 石晶. 基于ENCODER_ATT机制的远程监督关系抽取[J]. 广西师范大学学报(自然科学版), 2019, 37(4): 53-60.
[2] 宋俊, 韩啸宇, 黄宇, 黄廷磊, 付琨. 一种面向实体的演化式多文档摘要生成方法[J]. 广西师范大学学报(自然科学版), 2015, 33(2): 36-41.
[3] 张芬, 曲维光, 赵红艳, 周俊生. 基于CRF和转换错误驱动学习的浅层句法分析[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 147-150.
[4] 卓广平, 孙静宇, 李鲜花, 余雪丽. 一种基于CBR的个性化推荐算法[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 151-156.
[5] 刘金龙, 郭岩, 余智华, 刘悦, 俞晓明, 程学旗. 基于词聚类的跨媒体突发事件检测方法[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 23-31.
[6] 郑铿涛, 林楠铠, 付颖雯, 王连喜, 蒋盛益. 汉语-印尼语平行语料自动对齐方法研究[J]. 广西师范大学学报(自然科学版), 2019, 37(1): 89-97.
[7] 程显毅, 潘燕, 朱倩, 孙萍. 面向事件的多文档文摘生成算法的研究[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 147-150.
[8] 周鑫, 郝志峰, 蔡瑞初, 温雯. 带噪声的文本聚类及其在反垃圾邮件中的应用[J]. 广西师范大学学报(自然科学版), 2011, 29(2): 156-160.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发