当前位置：文档库 › 情感计算研究初探

情感计算研究初探

被严重误导的“情感计算”

被严重误导的“情感计算” 一、前言目前，人工智能呈现高速增长和全面扩张的态势，一方面人工智能不断朝更深层的智能方向发展：数学运算、逻辑推理、专家系统、模式识别、深度学习等；另一方面不断向社会的各个领域进行扩展：智能电视、智能手机、智能家居、智能交通、智能购物、智能城市、智能养老等。人工智能的下一个技术突破口必然是人工情感，只有实现了真正意义的人工情感，人工智能才会有更加广阔的发展空间，才会对社会生产力形成更加强大的推动力。然而，当今的计算机从原理上讲主要是基于逻辑推理式系统，根本不存在任何情感能力，人工智能也只是逻辑推理能力的体现。让计算机和机器人具有人类式的情感，是许多科学家的梦想。与人工智能技术的高度发展相比，人工情感技术所取得的进展却是微乎其微，“情感”始终是横跨在人脑与电脑之间无法愈越的鸿沟。 “情感计算”的概念是在1997年由MIT媒体实验室Picard教授提出，从而在世界范围内拉开了人工智能走向人工情感的序幕，激发出人们对于人工情感研究的强大兴趣。然而，这一理论存在着严重的缺陷，并把人们引向一个重大误区，致使“情感计算”研究在一阵短暂的繁荣之后，紧接着出现了长达十多年的沉寂。二、情感计算简介对人的情感和认知的研究是人工智能的高级阶段，它的研究将会大大促进拟人控制理论、情感机器人、人性化的商品设计和市场开发等方面的进展，为最终营造一个人与人、人与机器和谐的社会环境做出贡献。

1.美国的情感计算美国MIT媒体实验室Picard教授提出“情感计算”一词并给出了定义，即情感计算是关于情感、情感产生以及影响情感方面的计算。最近，美国加州Abyss Creations公司近日宣布，第一代性爱女机器人Harmony 已经成功研发出来，它具有学习能力，并且能与人类进行情感交流。 2.欧盟的情绪机器欧盟国家也在积极地对情感信息处理技术（表情识别、情感信息测量、可穿戴计算等）进行研究。欧洲许多大学成立了情感与智能关系的研究小组。其中比较著名的有：日内瓦大学Klaus Soberer领导的情绪研究实验室。布鲁塞尔自由大学的D. Canamero领导的情绪机器人研究小组以及英国伯明翰大学的A. Sloman领导的Cognition and Affect Project。在市场应用方面，德国Mehrdad Jaladi-Soli等人在2001年提出了基于EMBASSI系统的多模型购物助手。EMBASSI是由德国教育及研究部（BMBF）资助并由20多个大学和公司共同参与的，以考虑消费者心理和环境需求为研究目标的网络型电子商务系统。英国科学家已研发出名为“灵犀机器人”（Heart Robot）的新型机器人，这是一种弹性塑胶玩偶，其左侧可以看到一个红色的“心”，而它的心脏跳动频率可以变化，通过程式设计的方式，让机器人可对声音、碰触与附近的移动产生反应。

情感计算的研究现状与认知困境读后感

《情感计算的研究现状与认知困境》读后感《情感计算的研究现状与认知困境》选自《自然辩证法通讯》期刊2012年第2期，作者李佳源。本文主要介绍了当前情感计算的心理学依据以及所使用的情感测量、情感建模方法，介绍了当前学术界对情感计算的可能性、情感计算的理论基础以及情感计算技术应用后果的质疑。最后对如何消除这些质疑提出了一些初步看法。情感计算是近几年兴起的一个崭新的、充满希望的研究领域, 其目的是要赋予计算机感知、理解与表达情感的能力。本文首先在引言部分介绍了情感计算的起源与发展状况。“情感计算”最初由美国麻省理工学院( MIT) 的R.W.Picard教授在1997年提出,她将其定义为“关于情感、由情感引发以及意图影响情感的计算”。情感计算在人工智能和计算机领域发展迅速，但是当前对情感计算的认识在学界普遍存在一些偏差，甚至是认知上的一些困境。文章第一部分介绍了情感计算的依据与方法。情感计算设计过程依3种成分进行展开：主观体验、外部表现、和生理唤醒。计算机具有情感需具备以下能力：（1）情感表情；（2）多层次的情感产生；（3）情感体验；（4）身心交互。情感计算的方法是通过传感器直接或间接与人接触获得情感信息与数据，通过建模对情感信息进行分析与识别，对分析结果进行推理达到感性的理解，将理解结果通过合理的方式表达出去也就完成了情感交流的全过程。通过情感测量获取情感信息与数据的方法有主观体验测量方法、表情测量方法和生理测量方法。情感测量获得的数据要求具有典型性、自然型、完整性和可控性。当获取了情感数据之后，下一步的任务就是将情感信号与情感机理相应方面的内容对应起来，这就是要对所获得的信号进行建模和识别。情感建模方法可采用诸如隐马尔可夫模型、贝叶斯网络模式等数学模型以及一些非线性分析方法，如模糊理论、神经网络、混沌理论、遗传算法等。情感建模是情感计算的一个主要研究内容，如果我们能够为情感状况建立比较准确的模型，能够找到比较适合计算机科学的情感建模方法，则将大大促进计算机人工智能的发展。文章第二部分通过对3个问题的回答来表达了作者对于当前情感计算认知困境的理解。1.情感计算可能吗？情感可不可以计算实际上是一个哲学终极问题。支持者认为情感并非如心理学家所认为的那样仅仅是人的内心体验状态，而是可以通过人生理、表情、语言等体现出来，可以通过一定的技术进行测量与处理。反对者认为情绪是人类本身专有的，一旦它脱离人就不存在了或者说变成假的了。 2.情感计算的理论基础是什么？一些人认为应该把情感计算的理论基础建立在心理学之上，而另外一些人认为应该把情感计算的理论基础建立在“统一价值论”之上。 3.情感计算技术为我们带来什么？乐观主义者认为它将给我们生活带来更多的智能和便利，悲观主义者认为机器如果拥有情感将给我带来麻烦与问题。文章第三部分阐明了作者的总结与观点。作者认为：1、不能从哲学终极性的角度来看待情感计算的问题，关于情感计算，不是可不可以的问题，而是适合实践的需要与发展的问题，是必须要进行的事业；2、把情感计算的理论建立在

顾客忠诚度 ---文献综述

顾客忠诚度评价方法一、顾客忠诚度的定义第一个明确提出顾客忠诚这个名词是科普兰德,这一概念并很快就被认可,越来越多的学者开始在这一领域研究。早期研究中,学者们主要从消费者的再购率、消费者从本企业购买的产品数量在他们购买的同类产品总量中所占的比例、消费者的购买方式、消费者对企业的口头宣传、消费者与企业关系的持久性等方面计量消费者忠诚感.Tucker(1964)首次对顾客忠诚进行了数字化的度量,他认为“顾客忠诚的最好表述是顾客的行为,顾客连续购买某一品牌产品3次,既可以认为顾客忠诚于这个品牌”。Newman和Werbel(1973)从排他险角度对顾客忠诚进行了定义,他认为“品牌忠诚定义为重复购买某一品牌,并且只考虑该品牌,而且不需要收集其他品牌信息”。Bloemer和Ksaper(1995)将顾客忠诚分为两类:真实的顾客忠诚和不真实的顾客忠诚,真实的顾客忠诚是来源于公司产品或者服务的品牌承诺,而不真实的顾客忠诚则来源于顾客的惰性。他认为真实的顾客忠诚是偏向的、行为反应、在一系列类似的备选品牌中选择、以及是导致品牌承诺的心理过程的函数。而不真实的忠诚的定义则是是惰性的函数。基于认知、意动、情感、和行为这四个维度,Richard Ol iver(1999)对忠诚度做出了这样的定义:“顾客忠诚是顾客对在其未来进行购买某种类似产品或者服务时的一种发自内心的一种承诺,这种承诺会导致顾客在选择产品或者服务的时候,趋向选择同一品牌或者公司的产品”。Rowley(2005)认为顾客忠诚可以分为四个类型:俘获(captive)型、便利寻找者(convenience一seeker)、满意(contented)型和承诺(committed)型。国内学者罗海

文本情感分析综述

文本情感分析综述? 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001) A Survey of Sentiment Analysis * ZHAO Yan-Yan+, QIN Bing, LIU Ting (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@https://www.wendangku.net/doc/7d16517314.html, Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信 ?Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)

文本情感分类研究综述

Web文本情感分类研究综述王洪伟/刘勰/尹裴/廖雅国 2012-9-27 14:55:59 来源：《情报学报》(京)2010年5期【英文标题】Review of Sentiment Classification on Web Text 【作者简介】王洪伟，男，1973年生，博士，副教授／博士生导师，研究方向：本体建模和情感计算，E-mail:hwwang@https://www.wendangku.net/doc/7d16517314.html,。同济大学经济与管理学院，上海200092；刘勰，男，1985年生，硕士研究生，研究方向：数据挖掘与情感计算。同济大学经济与管理学院，上海200092；尹裴，女，1986年生，硕士研究生，研究方向：商务智能。同济大学经济与管理学院，上海200092；廖雅国，男，1954年生，博士，教授，研究方向：人工智能与电子商务。香港理工大学电子计算学系，香港【内容提要】对用户发表在Web上的评论进行分析，能够识别出隐含在其中的情感信息，并发现用户情感的演变规律。为此，本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务：主客观分类、极性判别和强度判别，对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状，并指出今后的研究方向。

Analyzing the users' reviews on the Web can help us to identify users' implicit sentiments and find the evolution laws of their emotion. To this end, this paper is a survey about the sentiment classification on the Web text. We divided the process of classification into three categories:subjective and objective classification,polarity identification and intensity identification and respectively summarize the resent research achievements in these fields. We also sorted the methods of polarity identification into two types: one is based on the emotional words with semantic characteristics, while the other statistic methods of natural language processing. What is more, the choice of corpus and potential research problems are discussed. At last, this paper summarized the status quo of application and pointed out the direction of future research. 【关键词】Web文本/情感分类/综述/主观性文本Web texts/Sentiment classification/Survey/Subjective text 随着互联网的流行，Web文本成为我们获取信息、发表观点和交流情感的重要来源。特别是随着Web2.0技术的发展，网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感，比如对某部大片的影评，对某款手机的用户体验等，其中蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘，获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentiment analysis)，就是确定说话人或作者对某个特定主题的态度。其中，态度可以是他们的判断或者评估，他们（演说、写作时）的情绪状态，或者有意（向受众）传递的情感信息。因此，情感分

情感分析简述

情感分析简述分类：NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析，我研究了也有半年有余了，ACL Anthology上关于情感分析的论文也基本看过了一遍，但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述，引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文，本文应该学术性比较强一点，本文虽不打算发表，但由于将来可能还有用，以及关于学术上的原因，请大家如果要引用请务必标明出处（https://www.wendangku.net/doc/7d16517314.html,/s/blog_48f3f8b10100irhl.html）。概述情感分析自从2002年由Bo Pang提出之后，获得了很大程度的研究的，特别是在在线评论的情感倾向性分析上获得了很大的发展，目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上，但是由于深层情感分析必然涉及到语义的分析，以及文本中情感转移现象的经常出现，所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库，虽然Bo Pang实验用的电影评论数据集（https://www.wendangku.net/doc/7d16517314.html,/people/pabo/movie-review-data/）以及Theresa Wilson等建立的MPQA（https://www.wendangku.net/doc/7d16517314.html,/mpqa/）是目前广泛使用的两类情感分析数据集，但是并没有公认的标准加以确认。目前情感分析的研究基本借鉴文本分类等机器学习的方法，还没有根据自身的特点形成一套独立的研究方法，当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法，半监督学习和无监督学习目前的研究不是很多，单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习，那么特征选择就是一个很重要的问题，N元语法等句法特征是使用最多的一类特征，而语义特征（语义计算）和结构特征（树核函数）从文本分类的角度看效果远没有句法特征效果好，所以目前的研究不是很多的。由于基于监督学习情感分析的研究已经很成熟了，而且在真实世界中由于测试集的数量要远远多于训练集的数量，并且测试集的领域也不像在监督学习中被限制为和训练集一致，也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的，为了和真实世界相一致，基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视，但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功，目前关于这方面的研究以及很少了，但是事实上，语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处，所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。以下将分别对情感分析的起源，目前基于监督学习，无监督学习，基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。起源虽然之前也有一些相关工作，但目前公认的情感分析比较系统的研究工作开始于（Pang et al., 2002）基于监督学习（supervised learning）方法对电影评论文本进行情感倾向性分类和（Turney,2002）基于无监督学习（unsupervised learning）对文本情感情感倾向性分类的研究。（Pang et al., 2002）基于文本的N元语法（ngram）和词类（POS）等特征分别使用朴素贝叶斯（Naive Bayes），最大熵（Maximum Entropy）和支持向量机（Support Vector Machine，SVM）将文本情感倾向性分为正向和负向两类，将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。（Turney ,2002）基于点互信息（Pointwise Mutual Information，PMI）计算文本中抽取的关键词和种子词（excellent,poor）的相似度来对文本的情感倾向性进行判别（SO-PMI算法）。在此之后的大部分都是基于（Pang et al., 2002）的研究。而相对来说，（Turney et al.,2002）提出的无监督学习的方法虽然在实现上更加简单，但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定，继续在无监督学习方向的研究并不是很多的，但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。监督学习目前，基于监督学习的情感分析仍然是主流，除了（Li et al.,2009）基于非负矩阵三分解（Non-negative Matrix Tri-factorization），（Abbasi et al.,2008）基于遗传算法（Genetic Algorithm）的情感分析之外，使用的最多的监督学习算法是朴素贝叶斯，k最近邻（k-Nearest Neighbor，k-NN），最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。（Pang et al., 2004）基于文本中的主观句的选择和（Wilson el al.,2009）基于文本中的中性实例（neutral instances）的分析，都是为了能够尽量获得文本中真正表达情感的句子。（Abbasi et al.,2008）提出通过信息增益（Information Gain，IG）的方法来选择大量特征集中对于情感分析有益的特征。而对于特征选择，除了N元语法和词类特征之外，（Wilson el al.,2009）提出混合单词特征，否定词特征，情感修饰特征，情感转移特征等各类句法特征的情感分析，（Abbasi et al.,2008）提出混合句子的句法（N元语法，词类，标点）和结构特征（单词的长度，词类中单词的个数，文本的结构特征等）的情感分析。除了对于文本的预处理，对于监督学习中情感分析还进行了以下方面的研究的。（Melville et al., 2009）和（Li et al.,2009）提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。（Taboada et al.,2009）提出结合文本的题材（描述，评论，背景，解释等）和文本本身的特征共同判断文本的情感倾向性。（Tsutsumi et al.,2007）提出利用多分类器融合技术来对文本情感分类。（Wan, 2008）和（Wan, 2009）提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。基于规则/无监督学习

网络社交媒体的情感认知与计算

本讲座选自清华大学电子工程系信息认知与系统智能研究所副所长黄永峰于2015年12月23日在清华RONGv2.0系列论坛之“社会关系网络与大数据技术”专场上所做的题为《网络社交媒体的情感认知与计算》的演讲。

黄永峰：各位老师、同学们，上午好！很荣幸有这个机会跟大家交流，我的题目是网络社交媒体的情感认知与计算。下面我将从这三个方面为大家逐一介绍。

情感计算的历史是1997年由MIT的Picard教授提出的，她指出情感计算是与情感相关，来源于情感或能够对情感施加影响的计算。情感分为四类：情感识别、情感表示、情感建模、情感交互。今天我讲的更像是情感识别方面的研究。情感计算分为四个过程：情感信息采集、情感识别分析、情感理解认知、情感信息表达，这四个方面我们做得更多的是识别分析，理解认知是我们下一步想做的。

Picard提出这个计算的时候，最开始的想法是从一些图像的表情、语音的语调、姿态中采集数据，通过特征信息的抽取和分析，最后识别情感而今天我所做的情感是利用互联网这样一个平台来采集大量语言的信息或者语言数据来分析个体的情感。我们为什么要采集情感？首先情感的采集比别的更丰富，语言是人类思维的直接现实，是思想的传播载体，也是情感表达的媒介，通过采集语言数据分析情感是完全可能的。但是有没有难度？有个统计数据指出一个语言的情感信息10%来自于语言本身的内容，20%来自于语言的语调、语气，70%来自于表情。传统语言的语调、语气信号用于分析情感相对更容易，而我们基于语言内容来分析情感难度会大很多。

什么叫情感？首先要对情感的模型有一个理解。Plutchik提出了一个最典型的情绪模型，他把人的情感分为八个类别、四个种类，分别用锥形模型和展开后的模型描述。从这两个模型我们能够看出情感的描述有很多方法，目前用得最普遍的是三维模型，把情感用强度划分为三个等级，这八个类别相对的是不同极性情感，相邻的情感区域的情感是很相似的，即情感的第3维，相似性。我们后面展开的情感研究主要是对这24类情感研究的一个简单的量化，情感很复杂，我们的研究从两个方面进行量化，第一个是强度，第二个是把相似性和极性合到一起研究。

文本情感分析研究现状

文本情感分析研究现状机器之心专栏作者：李明磊作为NLP 领域重要的研究方向之一，情感分析在实际业务场景中存在巨大的应用价值。在此文中，华为云NLP 算法专家李明磊为我们介绍了情感分析的概念以及华为云在情感分析方面的实践和进展。基本概念为什么：随着移动互联网的普及，网民已经习惯于在网络上表达意见和建议，比如电商网站上对商品的评价、社交媒体中对品牌、产品、政策的评价等等。这些评价中都蕴含着巨大的商业价值。比如某品牌公司可以分析社交媒体上广大民众对该品牌的评价，如果负面评价忽然增多，就可以快速采取相应的行动。而这种正负面评价的分析就是情感分析的主要应用场景。是什么：文本情感分析旨在分析出文本中针对某个对象的评价的正负面，比如「华为手机非常好」就是一个正面评价。情感分析主要有五个要素，（entity/实体，aspect/属性，opinion/观点，holder/观点持有者，time/时间），其中实体和属性合并称为评价对象(target)。情感分析的目标就是从非结构化的文本评论中抽取出这五个要素。

图1 情感分析五要素举例如下图：图2 情感分析五要素例子上例中左侧为非结构化的评论文本，右侧为情感分析模型分析出的五个要素中的四个（不包括时间）。其中实体「华为手机」和属性「拍照」合并起来可以作为评价对象。评价对象又可细分为评价对象词抽取和评价对象类别识别。如实体可以是实体词和实体类别，实体词可以是「餐馆」、「饭店」、「路边摊」，而实体类别是「饭店」；属性可以是属性词和属性类别，如属性词可以是「水煮牛肉」、「三文鱼」等，都对应了属性类别「食物」。实体类别和属性类别相当于是对实体词和属性词的一层抽象和归类，是一对多的关系。词和类别分别对应了不同的

情感计算综述

情感计算综述控制工程1102班李晓宇 2111103172 摘要：情感计算是人工智能的一个分支。情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境，并使计算机具有更高的、全面的智能。本文分别从情感计算的研究历史、应用前景、研究内容和理论框架来阐述情感计算，以便使更多的人了解情感计算。关键字: 情感计算；情感识别；情感理论框架 Summary of Affective Computing Abstract：Affective computing is a branch of artificial intelligence. The aim of affective computing is to give computers to recognize, understand, adapt to people's emotional expression and the ability to establish harmonious human environment, and to have higher computer, full of intelligence.This paper explain affective computing through the study of history of affective computing ,applications in the future, research content and theoretical framework, so that more people understand the affective computing. Key word: Affective computing; emotion recognition; the theoretical framework of emotional 1、引言情感计算的概念是在1997年由MIT媒体实验室Picard教授提出，她指出情感计算是与情感相关，来源于情感或能够对情感施加影响的计算。中国科学院自动化研究所的胡包刚等人也通过自己的研究，提出了对情感计算的定义：“情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境，并使计算机具有更高的、全面的智能”。在较长一段时期内，情感一直位于认知科学研究者的视线以外。直到20世纪末期，情感作为认知过程重要组成部分的身份才得到了学术界的普遍认同。当代的认知科学家们把情感与知觉、学习、记忆、言语等经典认知过程相提并论，关于情感本身及情感与其他认知过程间相互作用的研究成为当代认知科学的研究热点，情感计算（ affective computing ）也成为一个新兴研究领域。众所周知，人随时随地都会有喜怒哀乐等情感的起伏变化。那么在人与计算机交互过程中，计算机是否能够体会人的喜怒哀乐，并见机行事呢？情感计算研究就是试图创建一种能感知、识别和理解人的情感，并能针对人的情感做出智能、灵敏、友好反应的计算系统，即赋予计算机像人一样的观察、理解和生成各种情感特征的能力。 2、研究现状让计算机具有情感能力首先是由美国MIT大学Minsky教授（人工智能创始人之一）提出的。他在1985年的专著《The Society of Mind》中指出，问题不在于智能机器能否有任何情感，而在于机器实现智能时怎么能够没有情感。从此，赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT 媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著《Affective Computing》中提出并给出了定义，即情感计算是关于情感、情感产生以

Web文本情感分类研究综述

情报学报　ＩＳＳＮ１０００－０１３５第２９卷第５期９３１－９３８，２０１０年１０月ＪＯＵＲＮＡＬＯＦＴＨＥＣＨＩＮＡＳＯＣＩＥＴＹＦＯＲＳＣＩＥＮＴＩＦＩＣＡＮＤＴＥＣＨＮＩＣＡＬＩＮＦＯＲＭＡＴＩＯＮＩＳＳＮ１０００－０１３５Ｖｏｌ．２９　Ｎｏ．５，９３１－９３８Ｏｃｔｏｂｅｒ　２０１０收稿日期：２００９年６月２９日作者简介：王洪伟，男，１９７３年生，博士，副教授桙博导，研究方向：本体建模和情感计算，Ｅ－ｍａｉｌ：ｈｗｗａｎｇ＠ｔｏｎｇｊｉ．ｅｄｕ．ｃｎ。刘勰，男，１９８５年生，硕士研究生，研究方向：数据挖掘与情感计算。尹裴，女，１９８６年生，硕士研究生，研究方向：商务智能。廖雅国，男，１９５４年生，博士，教授，研究方向：人工智能与电子商务。１）　本文得到国家自然科学基金项目（７０５０１０２４，７０９７１０９９）；教育部人文社会科学资助项目（０５ＪＣ８７００１３）；上海市重点学科建设项目（Ｂ３１０）；香港研究资助局项目（ｐｏｌｙＵ５２３７桙０８Ｅ）资助。ｄｏｉ：１０．３７７２桙ｊ．ｉｓｓｎ．１０００－０１３５．２０１０．０５．０２３Ｗｅｂ文本情感分类研究综述１）王洪伟１　刘　勰１　尹　裴１　廖雅国２（１畅同济大学经济与管理学院，上海２０００９２；２畅香港理工大学电子计算学系，香港）摘要对用户发表在Ｗｅｂ上的评论进行分析，能够识别出隐含在其中的情感信息，并发现用户情感的演变规律。为此，本文对Ｗｅｂ文本情感分类的研究进行综述。将情感分类划分为三类任务：主客观分类、极性判别和强度判别，对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状，并指出今后的研究方向。关键词Ｗｅｂ文本　情感分类　综述　主观性文本ＬｉｔｅｒａｔｕｒｅＲｅｖｉｅｗｏｆＳｅｎｔｉｍｅｎｔＣｌａｓｓｉｆｉｃａｔｉｏｎｏｎＷｅｂＴｅｘｔＷａｎｇＨｏｎｇｗｅｉ１，ＬｉｕＸｉｅ１，ＹｉｎＰｅｉ１ａｎｄＬｉｕＮ．Ｋ．Ｊａｍｅｓ２（１畅ＳｃｈｏｏｌｏｆＥｃｏｎｏｍｉｃｓａｎｄＭａｎａｇｅｍｅｎｔ，ＴｏｎｇｊｉＵｎｉｖｅｒｓｉｔｙ，Ｓｈａｎｇｈａｉ２０００９２；２畅ＤｅｐａｒｔｍｅｎｔｏｆＣｏｍｐｕｔｉｎｇ，ＨｏｎｇＫｏｎｇＰｏｌｙｔｅｃｈｎｉｃＵｎｉｖｅｒｓｉｔｙ，ＨｏｎｇＫｏｎｇ）ＡｂｓｔｒａｃｔＡｎａｌｙｚｉｎｇｔｈｅｕｓｅｒｓ’ｒｅｖｉｅｗｓｏｎｔｈｅＷｅｂｃａｎｈｅｌｐｕｓｔｏｉｄｅｎｔｉｆｙｕｓｅｒｓ’ｉｍｐｌｉｃｉｔｓｅｎｔｉｍｅｎｔｓａｎｄｆｉｎｄｔｈｅｅｖｏｌｕｔｉｏｎｌａｗｓｏｆｔｈｅｉｒｅｍｏｔｉｏｎ．Ｔｏｔｈｉｓｅｎｄ，ｔｈｉｓｐａｐｅｒｉｓａｓｕｒｖｅｙａｂｏｕｔｔｈｅｓｅｎｔｉｍｅｎｔｃｌａｓｓｉｆｉｃａｔｉｏｎｏｎｔｈｅＷｅｂｔｅｘｔ．Ｗｅｄｉｖｉｄｅｄｔｈｅｐｒｏｃｅｓｓｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎｉｎｔｏｔｈｒｅｅｃａｔｅｇｏｒｉｅｓ：ｓｕｂｊｅｃｔｉｖｅａｎｄｏｂｊｅｃｔｉｖｅｃｌａｓｓｉｆｉｃａｔｉｏｎ，ｐｏｌａｒｉｔｙｉｄｅｎｔｉｆｉｃａｔｉｏｎａｎｄｉｎｔｅｎｓｉｔｙｉｄｅｎｔｉｆｉｃａｔｉｏｎａｎｄｒｅｓｐｅｃｔｉｖｅｌｙｓｕｍｍａｒｉｚｅｔｈｅｒｅｓｅｎｔｒｅｓｅａｒｃｈａｃｈｉｅｖｅｍｅｎｔｓｉｎｔｈｅｓｅｆｉｅｌｄｓ．Ｗｅａｌｓｏｓｏｒｔｅｄｔｈｅｍｅｔｈｏｄｓｏｆｐｏｌａｒｉｔｙｉｄｅｎｔｉｆｉｃａｔｉｏｎｉｎｔｏｔｗｏｔｙｐｅｓ：ｏｎｅｉｓｂａｓｅｄｏｎｔｈｅｅｍｏｔｉｏｎａｌｗｏｒｄｓｗｉｔｈｓｅｍａｎｔｉｃｃｈａｒａｃｔｅｒｉｓｔｉｃｓ，ｗｈｉｌｅｔｈｅｏｔｈｅｒｓｔａｔｉｓｔｉｃｍｅｔｈｏｄｓｏｆｎａｔｕｒａｌｌａｎｇｕａｇｅｐｒｏｃｅｓｓｉｎｇ．Ｗｈａｔｉｓｍｏｒｅ，ｔｈｅｃｈｏｉｃｅｏｆｃｏｒｐｕｓａｎｄｐｏｔｅｎｔｉａｌｒｅｓｅａｒｃｈｐｒｏｂｌｅｍｓａｒｅｄｉｓｃｕｓｓｅｄ．Ａｔｌａｓｔ，ｔｈｉｓｐａｐｅｒｓｕｍｍａｒｉｚｅｄｔｈｅｓｔａｔｕｓｑｕｏｏｆａｐｐｌｉｃａｔｉｏｎａｎｄｐｏｉｎｔｅｄｏｕｔｔｈｅｄｉｒｅｃｔｉｏｎｏｆｆｕｔｕｒｅｒｅｓｅａｒｃｈ．ＫｅｙｗｏｒｄｓＷｅｂｔｅｘｔｓ，ｓｅｎｔｉｍｅｎｔｃｌａｓｓｉｆｉｃａｔｉｏｎ，ｓｕｒｖｅｙ，ｓｕｂｊｅｃｔｉｖｅｔｅｘｔ随着互联网的流行，Ｗｅｂ文本成为我们获取信息、发表观点和交流情感的重要来源。特别是随着Ｗｅｂ２畅０技术的发展，网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感，比如对某部大片的影评，对某款手机的用户体验等，其中蕴含着巨大的商业价值。如何从这些Ｗｅｂ文本中进行情感挖掘，获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析（ｓｅｎｔｉｍｅｎｔａｎａｌｙｓｉｓ），就是确定说话人或作者对某个特定主题的 — １３９—

情感计算

情感计算-一、情感计算的概念情感计算的概念是在1997年由MIT媒体实验室Picard教授提出，她指出情感计算是与情感相关，来源于情感或能够对情感施加影响的计算。中国科学院自动化研究所的胡包刚等人也通过自己的研究，提出了对情感计算的定义：“情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境，并使计算机具有更高的、全面的智能”。情感计算-二、《情感计算》的作者自述目前这个世界与我当时写这本书时大不一样。当时情感计算几乎是令人困惑的，只有极少数的计算机界科学家或工程师愿意投入此项工作。计算机本身具有类似于情感机制的这种观点不是新的，它在Cap&Brother剧本R．U．R．创造出世界“机器人”这一词时就出现了，但具有有效情感机制的计算机实际上并不存在。有关人工智能的会议要么是忽视情感，要么是把情感边缘化。情感智能的观念在心理学和认知科学中变得越发重要，但没有人把它应用到人机交互中。神经科学和心理学上早已发现关于情感在决策、感知、创造性等方面的作用，而计算科学在很大程度上并不知晓。许多人不知道情感有助于理性和智能行为，普遍认为计算机的情感是一种空洞无聊的东西，就像蛋糕表面上的一层糖霜，可以用来使之更为悦目，但没有真正实质上的意义。我感谢当时与我讨论情感计算的几个同事。在出版这本书的前一年，我记得，麻省理工学院(MIT)人工智能实验室的一批研究人员邀请我发言，他们对以下问题十分感兴趣，即赋予计算机以类似情感机制这件事的重要程度如何，以及为什么这件事能对人工智能有用?情感即使带来好处，是否会造成更多的麻烦?答案不太明显，需要加以解释；而他们很欢迎这方面的证据。媒体实验室及其他单位的一些人员愿意听我的论证、提出问题、提出他们的想法和批评意见，甚至协作研究，得出了新的悟解。有些人特别是一些尚未取得终身任职的学术界的同行告诉我说：我的想法是荒唐的，我已经享有严肃研究者的声誉，致力于机器具有情感的研究可能会毁掉我的名誉。我记得我曾深刻内省，以决定是否继续从事这项研究。坦率地说，如果我工作在传统的学术部门，而不是在这样一个实验室，那里的领导层，特别是JerryWiesner和NicholasNegro~nte，经常公开地称颂大胆的想法并强烈鼓励冒险，我是不会像这样全心全意投入这项研究的。已经过去五年多了。今天，很难想像当时我竟会感到那样害怕。计算机中情感的研究，已经为很多学术界和工业界顶级的研究实验室接受，并引起了国际上的重大关注。自从这本书出版后，已经有20多个专题讨论会、会议以及特定集会，其主题均围绕情感和计算机运算，而且通常把情感计算列为一个学科领域。我不能、也不会对世界上这种改变自我居功。事实是，真理不依赖任何个人的努力而找到自己前进的道路。在追求它的过程中，我们在黑

文本情感分析综述

随着企业信息化与互联网的发展，信息以爆炸性速度飞速增长，其中包括了大量的非结构化与半结构化数据。非结构化与半结构化数据，主要是文本型数据，阐述5w问题，即who，when，where，what，Why。如何充分利用非结构化数据与半结构化数据，分析其包含的潜在信息，拥有支持决策，成为了众多企业与研究者关注的重点。尤其，针对互联网(如博客和论坛)上大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性，如喜、怒、哀、乐和批评、赞扬等。基于此，潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。由于越来越多的用户乐于在互联网上分享自己的观点或体验，这类评论信息迅速膨胀，仅靠人工的方法难以应对网上海量信息的收集和处理，因此迫切需要计算机帮助用户快速获取和整理这些相关评价信息。因此，如何从这些Web文本中进行情感挖掘，获取情感倾向已经成为当今商务智能领域关注的热点。情感分析(sentiment analysis)技术也就应运而生(本文中提及的情感分析，都是指文本情感分析)。文本情感分析(sentiment analysis)，又称为意见挖掘，是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。其中，主观情感可以是他们的判断或者评价，他们的情绪状态，或者有意传递的情感信息。因此，情感分析的一个主要任务就是情感倾向性的判断，Pang等人在文献1中将情感倾向分为正面、负面和中性，即褒义、贬义和客观评价。研究初期，大量研究者都致力于针对词语和句子的倾向性判断研究，但随着互联网上大量主观性文本的出现，研究者们逐渐从简单的情感词语的分析研究过渡到更为复杂的情感句研究以及情感篇章的研究。文本情感分析主要可以归纳为3项层层递进的研究任务，即情感信息的抽取、情感信息的分类以及情感信息的检索与归纳[2]。情感信息抽取就是将无结构的情感文本转化为计算机容易识别和处理的结构化文本。情感信息分类则是利用情感信息抽取的结果将情感文本单元分为若干类别，供用户查看，如分为褒、贬、客观或者其他更细致的情感类别。情感信息检索和归纳可以看作是与用户直接交互的接口，强调检索和归纳的两项应用。情感分析是一个新兴的研究课题，具有很大的研究价值和应用价值，正受到国内外众多研究者的青睐。目前实现情感分析的技术主要包括基于机器学习法和基于语义方法两类。本文主要针对这两大方法的研究进展进行比较分析，接着介绍国内外现有的资源建设情况，最后介绍情感分析的几个重要应用和展望它的发展趋势。 1 基于统计机器学习法随着大规模语料库的建设和各种语言知识库的出现，基于语料库的统计机器学习方法进入自然语言处理的视野。多种机器学习方法应用到自然语言处理中并取得了良好的效果，促进了自然语言处理技术的发展。机器学习的本质是基于数据的学习（Learning from Data）。利用机器学习算法对统计语言模型进行训练，最后用训练好的分类器对新文本情感进行识别。2002年，Pang 等人就在文献[1]中提出用机器学习的方法进行情感倾向的挖掘工作，他们以互联网上的电影评论文本作为语料，采用了不同的特征选择方法，应用朴素贝叶斯（Naive Bayes）、最大熵(Maximum Entropy)、向量机(SVM)对电影评论分别进行分类，实验表明SVM 的分类性能最好，准确率达到87.5%。该研究引起学术界的关注，之后用于倾向性判断的机器学习算法的改进被陆续提出，基本的算法有：支持向量机(SVM)、朴素贝叶斯(NB)、K-近邻(KNN)、简单线性分类器(SLC)和最大熵(ME)等。他们在另一项工作中，将文本极性分类问题转换成求取句子连接图的最小分割问题，实现了一个基于minimum-cut的分类器。[7]。Whitelaw等人[11]关注研究带形容词的词组及其修饰语(如“extremely boring”或“not really verygood”)，他们提取带形容词的词组作为特征，基于这些特征，用向量空间模型表示文