文档库 最新最全的文档下载
当前位置:文档库 › 信息可视化研究综述

信息可视化研究综述

基金资助:国家自然科学基金重点项目(编号:60533080)、教育部博士点基金资助项目(编号:20050335096)、浙江省科技计划项目(编号:2007C23096)。作者简介:程时伟,男,1981年生,博士研究生,主要研究方向:人机交互和人机界面设计。E-mail:caid4@https://www.wendangku.net/doc/327668588.html,(电话:138********,0571-********).孙守迁,男,1963年生,教授,博士生导师,主要研究方向:计算机辅助设计、图形学、人机交互。

信息可视化研究综述

程时伟1, 孙守迁1,2

(1.浙江大学计算机科学与技术学院,杭州 310027;2.浙江大学CAD&CG 国家重点实验室,杭州 310027) 摘 要要: 近年来,信息可视化技术逐渐成为计算机科学领域的一个研究热点。本文阐述了信息可视化的基本概念和参考模型,对可视化变量的特征和数据源的几何拓扑结构分别加以比较,并从文本可视化、多维可视化、Web 可视化以及可视化数据挖掘等方面描述可视化技术的基本特征、常用方法和应用进展。最后,讨论了存在的问题,指出了未来的研究方向。

关键词关键词:: 信息可视化 可视化 可视化变量 可视化数据挖掘

A A S S urvey on urvey on Information Visualization Information Visualization Information Visualization R esearch esearch

Cheng Shiwei 1, Sun Shouqian 1,2

(1.School of Computer Science and Technology, Zhejiang University, Hangzhou 310027, China; 2.State Key Lab of CAD&CG, Zhejiang

University, Hangzhou 310027, China)

Abstract : Recently, information visualization is emerging as a new hotspot of research in computer science. In this paper, the basic conception and reference model for information visualization are described, and both the characteristics of visual variables and topology structures of source data are compared respectively; then major approaches and the latest research progress of the information visualization applications such us text visualization, multi-dimension visualization, web visualization and visual data mining are summarized. The problems of current research are discussed, and finally the future directions are pointed out.

Key words : information visualization, visualization, visual variables, visual data mining

1 引言

可视化充分利用人们对可视模式快速识别的自然能力,将数据信息和知识转化为如图象、图形、表格等之类的视觉形式[1]。信息可视化使人们通过有效的用户界面浏览、探索、过滤抽象数据信息,并以便捷的交互方式有效地发现隐藏在信息内部的特点和规律。在数据统计、股票交易、电子商务、金融和通信等领域,信息可视化帮助人们在海量数据中迅速、有效的发现隐含的特征、模式和趋势,为科学研究、工程开发和业务决策提供依据,具有十分广阔的应用前景。

近年来,信息可视化的研究已引起了科研人员的密切关注, 欧美国家启动了相应的科研计划,在理论模型和应用技术方面已取得了较大进展,并在IEEE 系列会议(如INFOVIS,IV,VIS 等)、ACM 信息可视化和人机交互相关会议(如ACM NPIVM,ACM PVG ,ACM SIGCHI 等)发表了一些重要的研究成果。我国的信息可视化研究工作起步较晚,北京大

学、清华大学、武汉大学、浙江大学、中科院等单位开展了该领域的相关研究,但总体上还没有形成一定的规模,与国外先进水平还有较大差距。

本文综述了信息可视化领域目前的研究现状和主要进展,针对基本概念和参考模型、研究内容、应用领域、面临的挑战以及未来的趋势等展开讨论,期望能够推动同行学者对这一领域的关注。

2 基本概念和参考模型

2.1 基本概念

所谓信息可视化(Information Visualization,简称InfoVis 或IV ),就是利用计算机实现对抽象数据的交互式可视表示,来增强人们对这些抽象信息的认知[2]。可视化将信息以视觉形式表现出来,利用人们视觉通道的快速感知能力去观察、识别和加工信息。信息可视化是伴随商业数据的大量计算和数据仓库的大规模应用而兴起的,它同科学计算可视化最明显的不同之处在于处理的数据是诸如金融、商业等领域非物理的抽象数据,这些数据主要是由

多维的标量构成,缺乏明显的空间特征。在这种情况下,除了绘制对象的可视化属性以外,更重要的是将非空间的抽象信息映射为有效的可视化形式

[4]

2.2 参考模型 信息可视化是一个从数据到可视化形式的映射

过程,并通过这种交互式的映射来提高人的感知能

力。为了建立数据的可视映射,Card 等人提出了可

视化参考模型(Reference Model for Visualization )

[4]

,该模型描述了原始数据、数据表格、可视化结构

和视图之间的转换关系,以及用户根据任务通过人

机界面进行数据变换、可视化映射、视图变换等操

作,如图1所示。

原始数据(Raw Data):信息可视化通常研究的是抽象的、非空间的数据,原始数据的空间是无序的,一般不包含相关的描述性信息,数据之间也没有明显关联。

数据表格(Data Tables):通过数据表格的结构可以很容易将原始抽象数据映射为可视化结构。数据表格不仅可以描述数据的相关性,还包含了对原始数据进行描述的元数据。表1是一个数据表格的描述,其中的列表示数据实例,行表示数据变量。采用这种方法可以容易的发现数据中的变量数目和数据空间的维度,这对数据表格映射为可视化结构是很有帮助的。

表 1 数据表格的描述

Case i Case j Case k Variable x Value ix Value jx Value kx …… Variable y Value iy Valuj iy Value ky …… …… …… …… …… ……

可视化结构(Visual Structures ):可视化结构具有能够被人的视觉有效处理的图形属性,具有三个

基本的组成部分:空间基、标记及其图形属性。可

视化结构在一个空间基中用标记和图形属性对信息

进行编码。标记是空间中的可视化对象,包括点(0

维)、线(1维)、面(2维)、体(3维),和数学不同的是,这里的点和线也是有空间大小的。标记的

图形属性包括位置、排列、分辨率、透明度、数值

和各元素之间的关系。

视图变换是可视化参考模型的动力组件,可视

化结构通过视图变换形成最终的图形界面。常见的视图变换有三类[5]:①位置探查(Location probes),

利用可视化结构中的位置揭示数据表格中的附加信息,并将细节信息映射到确定的对象上去;②视点控制(Viewpoint controls ),利用仿射变换中的移动(zoom )、摇动(pan )和裁减(clip )等对视点进

行控制,实现视图变换;③变形(Distortion ),将总览(overview )和细节(detail )合并到一个单独的可视化结构。利用人机交互相关技术可以控制视图变换的参数,目前已开发出相机移动、局部细化、

鱼眼(Fisheye)和飞行浏览等各种交互技术[6]。

3 主要研究内容

信息可视化是处理抽象信息视觉显示的新型技术,它帮助用户发现隐藏在庞杂信息当中的模式和知识,为人们的决策提供重要的参考,主要解决两

个方面的问题:(1)发现新的可视化隐喻(metaphor )来表示信息,并提高人们对这些隐喻所支持的分析任务的理解能力;(2)研究怎样提高可视化系统的使用便利性。近年来,信息可视化的研究可从以下几个主要方面展开:

(1)可视化数据变量。从组成、属性

和感知性质等方面研究可视化变量的特征,进而通过分类方法对不同类型的数据进行可视化应用。

(2)文本信息可视化。研究图书、报纸、电子邮件、

网页等文本的信息属性与构成特点,通过可视化界面提高人们获取信息的速度和效率。研究内容包括单个文档的可视化和大型文档集合的可视化。

(3)层次信息可视化。操作系统文件目录、图书

图1 1 可视化参考模型可视化参考模型

①Data transformatio ns②Visual mappings

③View transformations

分类、文档管理都普遍存在层次信息结构,但随着信息量的急剧增加,大数量级结构层次与层次结点的可视化处理逐渐成为研究的重点。如利用三维空间的树型结构Cone Tree[7]和聚焦-背景技术(Focus+Context)[8]可以有效降低大型层次结构观测和操纵的复杂度。

(4)多维信息可视化。金融分析、股票预测和市场分析等通常需要处理多个数据变量,通过坐标变换、嵌套,以及多视图处理等手段可以将这些多维数据映射到传统的二维界面或三维空间内,如透镜表(Table Lens)[9]就实现了大型数据库中多变量数据的便捷浏览和特征识别。

(5)Web信息可视化。Web信息可视化的研究包括网页导航和布局、信息搜索的可视界面,以及网络多结点信息的动态显示与交互控制等。

(6)可视化数据挖掘。当前的可视化数据挖掘方法可分为三类[10]:①由传统的可视化方法组成或者独立于数据挖掘算法;②通过可视化对数据挖掘算法抽取的模式进行更好的理解;③结合多种可视化方法,使用户能方便对数据挖掘算法运行过程进行指导、操控。

(7)信息可视化的应用。研究在科学计算、信息检索、网络监控、股市分析、电子商务、生物医学、社会调查、交通管理、城市规划等领域的关键技术及应用,以及Prefuse[11]等可视化工具的开发。

4 信息可视化研究进展

4.1 可视化数据

4.1.1 可视化变量

任何视觉表现形式都由不同的可视化变量构成,这些变量根据不同的标准产生不同的分类。

根据标记的图形属性进行分析,可视化变量可分为8种:平面X,Y坐标、尺寸、属性值、纹理、色彩、方向和形状,前三个变量用来生成图形图像显示空间,后五个变量作为特征属性来区分不同的可视化元素。

根据感知特性可以将可视化变量分为5种[12]:

联系性变量:具有恒定的可视性,而非联系性的变量(如尺寸)的可视性是变化的。

选择性变量:如果用户可以将变量根据给定的类别分离出来,并有意识的将它们组成一幅图像,则说明该变量是选择性的,除了形状以外,所有的可视化变量都是选择性的。

次序性变量:如果变量是次序性的,则用户可以很快感知出元素之间的次序,如位置、尺寸、属性值和纹理都是次序性变量。

数量性变量:可以使用户分辨出两个给定值之间的数量差别,如位置和尺寸变量。

此外,还可把色彩变量继续细分为色相(hue)、亮度(lightness)和饱和度(saturation)。或者采用变量的集合构成更多的可视化变量。近来,还有学者把嗅觉、触觉和听觉在内的非视觉感觉变量作为可视化变量,这不仅拓宽了可视化变量的研究范围,更为视觉障碍者提供了获取信息的感知方式。

4.1.2 数据分类

对于信息可视化中数据类型的划分,可以参考基于任务分类学的数据类型[13](TTT, data Type by Task Taxonomy)。TTT定义了7种基本任务:总览、缩放、过滤、按需细化、关联、历史和提取;并将数据分为7类:一维线性数据、二维数据、三维数据、多维数据、时态数据、树型数据和网状数据,具体描述如下:

(1)一维线性数据

以一维线性方式组织的数据,如程序源码,文本等。早期处理一维大数据集的方法是双焦显示,这种方法为所关注的区域提供了详细的信息,而很少提供上下文区域的信息[4]。另一种方法是用大小固定且类似滚动条的空间上显示大量数据项的属性值[14]。

(2)二维数据

二维数据又叫平面数据,数据集中的对象具有形状、大小、颜色等特征,如平面布局图、地图和报纸版面布局等。二维数据的可视化方式可以避免语言处理带来的脑力工作,对信息检索和知识挖掘非常有利,在研究和商业领域有着广阔的应用前景[15]。ThemeView[4]是一种对大型文档集合之间的关系进行可视化的工具,它用显示山峰与山谷的自然地形图表示大型文档集合中的各个主题及相关信息的分布情况。

(3)三维数据

信息可视化对三维数据的处理,主要集中在数据对象的体积、表面积、位置、方向、遮挡与导航等方面。采用的技术包括总览法、地标法、透视法、色彩编码法、透明法和多重显示等。目前,三维数据的可视化主要应用在医学影像、建筑CAD、机械设计、科学仿真等领域。

(4)多维数据

多维数据的可视化是将具有n(n>3)个属性的数据对象映射为n维空间中的标记。主要的任务包括发现模式、集簇、变量之间的关系、以及偏差和孤立点。多维数据一般通过降维技术映射到二维或三维可视化空间,如使用动态的二维图实现多维数据的缩放、色彩编码、动态查询等功能;如使用三维的分布图,则要注意方向迷失和遮挡给用户认知和操作带来的困难。分层聚类、k-平均(K-means)聚类等方法也是常用和有效的多维数据可视化技术。

(5)时态数据

时态数据的特征是所有的数据对象都有一个生命周期,并且对象之间在时间上存在叠加的可能。主要的任务包括查找某一时刻及附近时域的信息、周期现象的比较和前面谈及的7种基本任务。在项目管理领域,时态数据可视化的代表工具是TimeSearcher[16],它把多个时间序列或其他线性数据序列结合起来进行分析。时态数据的可视化主要应用在股票市场价格分析,气象预测和生物电信号分析等领域。

(6)树型数据

数据对象的集合呈现层次结构和树型结构,每个叶结点(根结点除外)都有一个父结点与之相连,结点和结点之间的连接包含着多个属性。Widows 操作系统通常采用树型结构来浏览文件,其他文件浏览器也有采用兴趣度树(Degree-of-Interest Tree)[17]、空间树(SpaceTree)[18]、双曲线浏览器(Hyperbolic Browser)[19]等可视化方法。近来,一种在给定矩形平面通过填充任意大小树型结构的显示方法-树图(Treemaps)[20]正在市场分析、产品目录搜索、农产量监测等领域得到广泛应用。

(7)网状数据

当数据关系复杂到难以用树型结构表示时,一般采用网络结构使数据对象连接起来。网络数据集中的节点不受其他与之相联的有限节点的限制(而层次节点则不同,它们只有一个父节点),且没有内在的等级结构,两个节点之间可以有多种联系,节点以及节点间的关系可以有多个属性。拓扑结构包括无环、栅格、直接与间接连通、有原点与无原点等形式。用户在查看网络结点和连接等信息外,一般还会考虑接点之间最短路径或最小费用等问题。目前,网状数据可视化在GIS地理信息系统和互连网可视化[21]等领域已经取得了一定进展,但由于数据结构比较复杂,网状数据可视化的技术还不完善。

这7种数据类型还有许多变形和多种数据的结合体,但都是对现实中各类数据信息进行抽象。4.2 文档(文本)信息可视化

目前,文本信息的可视化研究主要集中在单个文档本身的可视化和大型文档集合的可视化。对于单个文档的可视化,主要有以下两种方法:像素编码法:文档中的每个字符用一个像素表示,并利用色彩、面积、形状等对文档有关属性进行编码。这种方法对文本信息的压缩比较高,可以在有限的界面空间显示大量的文本内容,但要注意界面布局与数据操作方式对可用性的影响,因为用户对这种可视化隐喻往往缺乏直观的理解。Eick等人根据这一思想开发了一种对计算机程序代码进行可视化管理的工具SeeSoft[4]。SeeSoft将每行代码根据其长度映射为一条短线, 每条短线的颜色可以用来表示某种统计特征,如红色表示最近修改过的代码,蓝色表示很少修改过的旧代码。

字符标记法:直接使用字符本身来表示文本内容,但在字符的大小、颜色、空间排列等方面经过了适当的可视化处理。例如,童话故事“艾丽斯漫游仙境”(Alice in Wonderland,https://www.wendangku.net/doc/327668588.html,)的全部文本被排列成圆形,内部是文本中的一些关键词,出现频率越高的关键词亮度越大,点击关键词可以在圆弧中显示相应的位置,并在附属窗口中利用滚动条查阅所需的详细信息,如图2所示。

图2 2 ““艾丽斯漫游仙境

艾丽斯漫游仙境””文本

文本可视化

可视化

可视化 对于大型文档集合的可视化,主要的可视化方法有以下三种:

高维空间描述法:对于一个包含有N篇文献的文本集合, 从中抽取出m个不同的主题词或关键词, 使得集合中任意一篇文献都可以用一个m维向量V=(V1,V2,…,V m)表示,分向量V1,V2,…,

V m与对应的主题词或关键词的出现频率和分布有关,于是在m维空间中, 每篇文献都可以用一个点表示,空间点的分布状况(如聚类)就代表了文献间的相关程度[22]。文献[23]在linear subspace[24]的基础上将欧盟第六框架信息科技项目的大量多维文档信息映射到二维平面图上,如图3所示。

图3欧盟第六框架IST项目可视化[24]

自组织地图法(SOM, Self-Organization Map)[25]:SOM是神经网络中用于聚类的主要方法之一,可以把复杂的非线性高维数据映射到一个低维空间中,保留输入数据的原始拓扑关系并用简单的几何关系表示输出结果。SOM分类地图可以对语义相近的文档进行聚类,并为每个类别自动分配一个标签来说明主题。美国亚利桑那大学的研究人员在SOM 的基础上方法开发出了娱乐信息地图系统ET-MAP (https://www.wendangku.net/doc/327668588.html,/research/dl/etmapdemo.htm)。

图符标识法:基于分类法思想,以图的形式将文献集合进行分类显示, 用户通过由粗到细的方式逐级接近检索目标或直接对图符集合进行搜索。虽然类似于网站搜索引擎的分类方法, 但图符标识法可以在屏幕可用范围内尽可能的直接显示出各个节点及其包含的文献数量, 方便用户了解各类文献之间的关系和调整检索目标。

4.3 多维信息可视化

绝大多数抽象信息是三维以上的多维信息,如金融信息、股票信息、数据仓库信息等,因此多维信息的可视化是信息可视化的一个重要目标。多维数据可视化过程包括数据解释和数据显示两个阶段[26]。数据解释将数据集中的数据对应于可视化元素,并和面积、长短、深度、方向、风格等可视化特征进行映射,然后通过组合不同的可视化方法进行数据显示。

对于多维信息而言,有时发现它的内部特征是很难的,需要先通过降维技术简化数据的复杂度,获得数据与信息的总体结构特征后,再将其映射为图形可视化形式,具体过程如图4所示。近年来,研究人员提出的降维方法包括:自组织特征映射网络算法[27],SBP向量映射[28],多维排列(Multidimensional Scaling, MDS)[29],弹性网络图(Elastic Net Maps)[30]等。

①原始文本数据,②图形可视化,③高维数据,④二维/三维数据,⑤数据转换,⑥降维,⑦可视化映射

图4高维文本数据可视化流程图

4.4 Web可视化

web信息可视化在帮助人们理解web信息空间的结构,提高信息获取与维护的效率。Web 信息空间呈网状结构,这方面的研究主要集中在如何有效地可视化信息空间的网络结构,具体可分为单个网站和网站(网页)集合的可视化。

单个网站的可视化:Web 是由大量网站组成的,单个网站的可视化在Web 可视化中具有重要的地位。很多网站都用站点地图Sitemap来显示网站的信息结构,但是对于那些包含数以千计页面的大型网站来说,这种方法仍显不足。树图通常作为一种可视化隐喻来表示网站复杂的层次结构。Ed H.Chi[31]等人提出了一种描述网站变化的可视化方法,它将Xerox网站中的7000 多个节点组织成一个树,树图中节点的颜色、大小和图标等代表相应页面的一些属性,如页面的标题、更新情况、页面类型(文字或图片)等,根据网页的访问量决定相应节点之间连线的颜色和粗细,并对整个树图进行动态更新。Eick设计了双曲线式的树-鱼眼(Hyperbolic Tree + fisheye)[32]视图来显示站点图。但随着网站页面的增多,树的结构也越来越庞大和复杂,会使用户的认知效率受到一定影响。

网站(网页)集合的可视化:网站集合的可视化主要用于互联网信息的显示与管理,特别是与网络

https://www.wendangku.net/doc/327668588.html,

搜索紧密结合起来,如利用树来表示网址的链接结构,通过Focus-context技术,根据用户的检索关键词调整树的结构,突出显示最匹配的网页节点。此外,单个网站可视化的相关技术进行改进后也能在网站集合的可视化研究中发挥作用。

4.5 可视化数据挖掘

可视化数据挖掘(Visual Data Mining, VDM)指的是采用可视化的方式让用户理解、检查、操作数据挖掘算法,一般包括数据选择、数据转换、数据验证、工具选择、模型分析、模型验证和展示等阶段。可视化数据挖掘工具和技术能够使用户形象地对分类、关联、簇和其他数据挖掘模型进行检查和交互,比传统的联机分析处理(OLAP)的效率要高很多。但是,不是所有的数据算法产生的模型都能可视化(或者说不能称作是有意义的可视化),例如,用于分类的神经网络模型、估值、簇、全体决策树、线性回归等就不能进行合适的可视化,而决策树、关联规则、聚类等则是可以可视化的[33]。

频率图,如直方图和分布图等可通过比较关键业务指标在业务数据集中的其他字段(维度)上的分布,并对其做出评估;帕雷托图(直方图和折线图的合并)可以评估业务数据集中一个字段相对于关键业务指标的重要性,如市场占有率等;雷达图可用于寻找和评估全部业务数据中存在的季节流行趋势;折线图可以分析和寻找基于时间的趋势和模式;散点图可以评估字段间存在的因果关系。此外,也可在数据挖掘中结合缩放、鱼眼等交互模式,采用散点图、平行坐标、自组织图等方法来对数据进行可视化处理。

随着可视化数据类型的日益增多和复杂化,可视化形式将从静态图表转变为动态交互方式[33]:动态可视化允许用户对数据进行旋转、缩放和增加信息展示的角度,从而提高用户获得有用知识的能力。例如,对同一个数据集进行多种视图的显示,这种联合可视化方法让用户可以拥有多个单一数据集上的同步视图;并允许用户通过点击或者圈取的形式选择特定的数据点,对生成的数据子集进行可视化查询。动态可视化还可以延伸到对不断变化的数据进行分析,如用动画的形式查看月销售额在一年中的变化。

此外,针对Web数据等半结构化、非结构化的可视化数据挖掘也开始兴起;同时,将统计学、机器学习、运筹学、仿真技术等传统方法与可视化紧密结合,融入到数据挖掘的过程中,可以改善可视化数据挖掘过程的质量和速度[10]。

4.6 信息可视化应用

信息可视化技术往往用于金融、物流、互联网等行业大量高复杂度抽象信息的显示、认知与操作,主要应用包括以下几个方面:

网络通信监控:随着多媒体与互联网技术的迅速发展,网络潜在的数据量和复杂程度均以很大的数量级在递增,通过信息可视化可以方便的显示网络结点特性、网络连接与流量、较大区域或地理分组等信息,为数据通信的监控提供便利。例如,英国电信公司(BT)的网络每5分钟大约有6万个运行情况参数报告给中央操作单元(Central Operations Unit),通过绘制运行参数的地理分布图和每个区域中极值、平均值的彩色线条图,以及反映选定时间间隔中参数变化情况的动画,工作人员可以利用中央操作单元对网络进行实时监测和控制[34]。

网络信息检索:网络信息可视化检索辅助系统WIDAS[35]是日本东京理科技术大学开发的用于网络知识发现的信息可视化和检索集成工具,它利用3D双曲线树来表示网址的链接结构,树内每个节点(对应一个网页)的高度表示用户对该网页的感兴趣程度,实验表明,用户可以更准确和有效的从一个庞大的网站中检索到所需的网页信息。

股市信息可视化:股民通过可视化系统可以迅速理解和接受各种信息,发现股市信息中的特征和走势,以便迅速做出投资决策。例如,美国University of Maryland的人机交互实验室开发的TimeSearcher[21],通过时间序列图显示股市中的时态数据,并对每个区域、每个时间段的股票收益等特性提供多变量的图形分析工具,帮助用户快速检索所需的股票信息。

金融分析:金融信息的可视化可以帮助人们进行复杂金融数据的理解与分析,如共同基金市场分析、资产统计、货币流通总量与现金运作水平统计、信用卡交易数据分析等。Keim[36]等人利用“增长矩阵”(Growth Matrices)的动态多视图可视化模型来帮助资产分析。新加坡NTU大学启动的FIDA VIZ[37]项目通过3D世界地图来显示欧洲共同基金市场的相关数据。此外,意大利中央银行还使用可视挖掘软件从异常现象中发现通过银行系统进行的非法洗钱活动。

https://www.wendangku.net/doc/327668588.html,

市场分析:Treemap[20]是一种在给定平面通过填充任意大小树型结构的显示方法,该方法被用来对产品市场进行分析,如用不同颜色的矩形表示不同类的产品,用矩形的大小表示相应的市场占有率。通过这种可视化形式,市场分析人员可以很快对产品的市场占有率和竞争关系做出判断,并能根据动态的更新显示追踪市场变化。

5 存在的问题与未来方向

信息可视化是一个新兴的研究领域,近几年来相关的理论研究和应用技术已经越来越成熟,取得了长足的进步。然而,由于信息可视化任务自身的特殊性,该领域仍然存在许多有待解决的问题,总结起来有以下几个方面[38],[39]:

对信息采集与输入的完善

在信息采集过程中,躁声数据和不完全采样是降低原始数据质量的主要问题,这将严重影响后续的可视化处理过程。同时,采集来的各类信息在输入过程中,必须经过适当的过滤机制,转换成恰当的格式。丢失数据的处理和数据属性值的规格化都是繁重的工作,提高输入的准确性和效率都是可视化研究中亟待解决的问题。

海量数据可视化的完善

海量数据的处理是信息可视化的一大挑战,目前大多数可视化原型系统一般只能处理几千条数据项,或者当处理大量条目时无法保证实时响应。利用新的图形加速卡、大屏幕显示等硬件技术手段虽然可以解决部分问题,但发现新的图形属性来支持海量数据的可视化才是更值得关注的方向。综合考虑大容量和高分辨率显示、视图平滑过渡、实时交互控制等因素,海量数据的可视化方法还需要进一步的研究。

可视化数据挖掘的完善

近年来,可视化数据挖掘已经证明在探索性数据分析和处理大型数据库中极具价值和潜力。但同时,却很少有成功的商业化数据挖掘软件出现,问题在于大多数开发都集中在挖掘算法设计方面,而往往忽视用户的认知特点与人机界面需求。可视化数据挖掘技术的研究与发展,恰恰突出了可视化人机界面对用户在进行数据挖掘时的引导和帮助,因此越来越多的研究者正致力于将这两种方法结合起来研究。

此外,许多相关领域的研究成果也可以供信息可视化借鉴,如网络、计算机图形学、数据挖掘、人机交互、认知心理学等技术也都促进了信息可视化领域的发展,一些新的方向正在兴起,如研究信息可视化系统的可用性、建立可视化评价模型、信息可视化中的认知模型等。

参考文献

[1]Nahum D, Stephen G. Information visualization [J].

IEEE Computer Graphics and Applications, 1997,

17(4):29-31.

[2]Bederson B, Shneiderman B. The craft of information

visualization: readings and reflections. San Francisco:

Morgan Kaufmann Publishers, 2003.

[3]Ware C. Information visualization: perception for design.

Second Edition, San Francisco: Morgan Kaufmann

Publishers, 2004.

[4]Card S, Mackinlay J, Shneiderman B. Readings in

information visualization: using vision to think. San

Francisco: Morgan Kaufmann, 1999.

[5]冯艺东,汪国平,董士海.信息可视化.工程图学学报

[J].2001(增刊):324-329..

[6]周宁,张玉峰,张李义.信息可视化与知识检索.北京:科学

出版社,2005..

[7]Robertson G, Mackinlay J, Card S. Cone trees: animated

3D visualizations of hierarchical information [C]. In

Proceedings of the SIGCHI Conference on Human

Factors in Computing Systems: Reaching Through

Technology. CHI '91. ACM, New York, NY, 189-194.

[8]Lamping J, Rao R, Pirolli P. A focus+context technique

based on hyperbolic geometry for visualizing large

hierarchies[C].In Proceedings of the SIGCHI Conference

on Human Factors in Computing Systems. ACM

Press/Addison-Wesley Publishing Co., New York, NY,

1995,401-408.

[9]Rao R, Card S. The table lens: merging graphical and

symbolic representations in an interactive focus+context

visualization for tabular information [C]. In Conference

Companion on Human Factors in Computing Systems.

ACM, New York, NY, 1994, 222.

[10]耿学华,傅德胜.可视化数据挖掘技术研究[J].计算机应

用与软件,2006,23(2):85-87.

[11]Heer J, Card S, Landay J. prefuse: a toolkit for

interactive information visualization[C]. In Proceedings

of the SIGCHI Conference on Human Factors in

Computing Systems. ACM, New York, NY, 2005,

421-430.

https://www.wendangku.net/doc/327668588.html,

[12]宋绍成,毕强,杨达.信息可视化的基本过程与主要研究

领域[J].情报科学, 2004,22(1):13-18.

[13]Shneiderman, B. Designing the User Interface: Strategies

for Effective Human-Computer Interaction. 4th ed.

Boston: Addison-Wesley, 2004.

[14]Chimera, R. Value bars: an information visualization and

navigation tool for multi-attribute listings [C]. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems .ACM Press, New York, NY, 1992, 293-294.

[15]Dykes J, MacEachren A, Kraak M. (Editors), Exploring

Geovisualization. Elsevier, Amsterdam, the Netherlands, 2004.

[16]Hochheiser H, Shneiderman B. Dynamic query tools for

time series data sets: timebox widgets for interactive exploration [J]. Information Visualization, 2004, 3(1):1-18.

[17]Heer J, Card S. 2004. DOI Trees revisited: scalable,

space-constrained visualization of hierarchical data[C].

In Proceedings of the Working Conference on Advanced Visual interfaces. AVI '04. ACM Press, New York, NY, 421-424.

[18]Plaisant C, Grosjean J, Bederson B. SpaceTree:

Supporting Exploration in Large Node Link Tree, Design Evolution and Empirical Evaluation [C]. In Proceedings of the IEEE Symposium on information Visualization (infovis'02). INFOVIS. IEEE Computer Society, Washington, DC, 57

[19]Pirolli P, Card S, Van Der Wege, M. The effects of

information scent on visual search in the hyperbolic tree browser. ACM Trans. Comput.-Hum. Interact. 2003, 10(1): 20-53.

[20]Shneiderman B. Treemaps for space-constrained

visualization of hierarchies [OL].

https://www.wendangku.net/doc/327668588.html,/hcil/treemap-history

[21]Dodge M, Kitchin R. Atlas of Cyberspace. Boston:

Addison-Wesley, Reading, 2001

[22]刘玮,周宁,张芳芳.基于文本的信息可视化方法研究[J].

现代图书情报技术, 2003,2:34-36,47.

[23]Fortuna B, Mladenic D, Grobelnik M. Visualization of

text document corpus [J]. Informatics Journal, 2005,29:497-502

[24]Shawe TJ, Cristianini N. Kernel Methods for Pattern

Analysis. Cambridge University Press, 2004.

[25]Brin S, Page L. The anatomy of a large scale

hypertextual Web search engine [C]. In Proceedings of

the Seventh International World Wide Web conference,1998, 107-117

[26]任东怀,胡俊.多维数据可视化技术综述[J].工程地质计

算机应用, 2006,4(44):4-9,34.

[27]Wu Z, Yen GG. A SOM projection technique with the

growing structure for visualizing high-dimensional data

[C].In Proceedings of the International Joint Conference

on Neural Networks, 2003:1763-1768.

[28]Johnson R. Visualization of multi-dimensional data with

vector fusion [C]. In Proceedings of IEEE Visualization, 2000:297- 302, 570.

[29]Dinitris K, etc. Multidimensional scaling and

visualization of large molecular similarity tables [J].

Journal of Computational Chemistry,2001,22(5):488-500 [30]Gorban A, Zinovyev A. Method of elastic maps and its

applications in data visualization and data modeling [J].

International Journal of Computing Anticipatory Systems, 2001,12:353-369

[31]Chi E, etc. Visualizing the evolution of Web ecologies.

In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems [C]. ACM Press/Addison-Wesley Publishing Co., New York, NY, 1998, 400-407.

[32]Eick S. Visualizing Online Activity [J]. Communications

of ACM, 2001, 44(8): 45-50.

[33]Soukup T, Davidson I,著.朱建秋, 蔡伟杰,译.可视化数

据挖掘-数据可视化和数据挖掘的技术与工具.北京:电

子工业出版社,2004..

[34]黄志澄.数据可视化技术及其应用展望

[OL].https://www.wendangku.net/doc/327668588.html,/visualtech/viz.htm. [35]Hayato O, Fumio M. Integrating information

visualization and retrieval for WWW information discovery [J]. Theoretical computer science,2003,292:547-571

[36]Daniel AK, et al. A Spectral Visualization System for

Analyzing Financial Time Series Data [C]. In Proceedings of Eurographics /IEEE-VGTC Symposium on Visualization (EuroVis 2006):195-202.

[37]Financial Engineering & Visualization

[OL].https://www.wendangku.net/doc/327668588.html,.sg/home/ASprakash/research/fi

nancial_engineering.htm

[38]Shneiderman B, Plaisant C. Designing the User Interface.

Forth Edition, Addison Wesley, 2005.

[39]Fayyad U, Grinstein G, Wierse A. Information

Visualization in Data Mining and Knowledge Discovery.

San Francisco: Morgan Kaufmann Publishers, 2001.

https://www.wendangku.net/doc/327668588.html,

相关文档
相关文档 最新文档