文档库 最新最全的文档下载
当前位置:文档库 › 微博情感分析研究综述

微博情感分析研究综述

龙源期刊网 https://www.wendangku.net/doc/fc2896585.html,

微博情感分析研究综述

作者:黄时友

来源:《新西部·中旬刊》2014年第10期

【摘要】本文阐述了国内微博及国外微博情感分析的研究现状,分析了微博情感分类方法的优缺点,提出了研究方法的改进方向。认为,目前中文微博情感分析研究缺乏完善的情感词典,缺乏针对话题型做特定的分析,同时也缺乏适用于特定话题的领域情感词典。因此,今后微博情感分析的改进思路是:针对话题微博文本进行情感分析;完善情感词典并丰富情感词的情感强度;考虑更多的情感特征项,将更多的语法规则和短语加入到情感词典中。

【关键词】微博;微博情感;分类;研究综述

随着互联网在中国的普及,人们的生活方式也逐渐地发生变化,越来越多的人通过互联网获取和发布信息。众多的社会化媒体平台开始诞生,例如博客、微博、社交网络等。在

Web2.0时代的主流网络社交平台中,由于微博拥有快速传播、及时、自由、灵活、简短特点,广大互联网用户开始在微博上传播政治话题、体育话题、娱乐话题。每天都有大量的具有分析价值的微博评论产生,这些评论信息包含大量情感信息和观点。大量针对微博的研究随之而来,目前微博情感分析的研究主要针对英文微博文本,面向中文微博情感分析的研究尚处于起步阶段。通过对微博情感分析相关文献的研究,本文对国内外的微博情感分析研究进行综述,归纳国内外微博情感分析采用的方法,并对分析方法的优缺点进行总结。

一、国内微博研究综述

综合中文微博情感分析的研究文献,中文微博情感分类主要有两类方法:基于情感词典的情感分类和基于机器学习的情感分类。

基于情感词典的情感分类。文献[1]考虑到感叹词对情感强度的增加,中文否定词、多重

否定对情感极性的影响,通过定义态度词典、权重词典、否定词典、程度词典以及感叹词词典来计算每条微博的情感指数。考虑到微博内容的丰富和复杂,文献[2]提出基于语义的词典加

规则的方法,构建短语的情感词典,更进一步将具有情感极性的短语和短语规则加入其中,提高微博文本情感极性分类的效果。文献[3]提出词典与机器学习相结合的方法,以动词、形容

词作为特征,用情感词典计算特征的极性值,最后用SVM对微博文本进行三元情感分类。为了解决一词多义的情况,文献[4]提出两个极性词典结合使用,对具有不同极性的词语进行人

工判定,从而降低歧义造成的情感分类误差。

基于机器学习的情感分类。文献[5]提出使用三种机器学习算法、三种特征选取算法以及

三种特征项权重计算方法,对微博进行了情感分类的实证研究,结果表明三种机器学习算法各有优势。文献[6]利用微博表情图和情感词语构建中文微博情感语料库,在此基础上构建贝叶

斯分类器对微博文本进行情感分类,提高了分类的准确性。

相关文档