文档库 最新最全的文档下载
当前位置:文档库 › 浅谈人机自然交互技术

浅谈人机自然交互技术

浅谈人机自然交互技术
浅谈人机自然交互技术

浅谈人机自然交互技术

摘要:随着人类社会和虚拟现实技术的发展,我们需要一种更简便智能的交流,

于是有了人机交互技术的产生。本文首先介绍了人机自然交互技术的概念和发展

历史,分析了其和其他学科之间相互渗透的关系,还论述了人机交互技术的研究

内容。此外还展望了它的未来发展方向。

关键字:人机交互;人机自然交互技术;自然和谐

The Discussion of the Natural Man-machine Interaction Technology

Huaxiaoling(11110842194)Wenzhou University

ABSTRACT:With the human society and the development of virtual reality technology, we need a more convenient intelligent communication, so the technology of man-machine interaction are produced. This paper introduces the natural man-machine interaction technology concept and development history firstly, analyzes its and other disciplines relationship, and also discusses the research content of human-computer interaction technology. In addition prospects its future development direction.

KEYWORD:Human-computer Interaction; Natural Man-machine Interaction Technology;

Natural Harmony

1 引言

随着技术的飞速发展,人们在自然语言理解、多通道交互、笔式交互以及智能用户等方面开展了很多工作。由于计算机科学发展水平的限制,在计算机和人类之间还存在着一条鸿沟。人们对于现存的人机交互方式并不满足,并且人与人的交互不是通过忍受操作来实现的,而是通过听觉与视觉以语言、表情、手势和体势进行的。人们期望新一代的人机交互能像人与人交互那样自然、准备和快捷。于是在20世纪90年代人机交互的研究进到了多模态的阶段,称为人机自然交互。人机交互(Human-Computer Interaction,简称HCI)就是连接人和计算机的桥梁,它使人和机器的关系从“人围着极其转”向“机器围着人转”的方向发展。

2 人机交互简介

2.1 人机交互的概念

人机交互技术(Human-Computer Interaction Techniques简称HCI)是指通过计算机输入、输出设备,通过有效的方式实现人与计算机对话的技术。HCI是关于设计、评价和实现供人们使用的交互式计算机系统,且围绕这些方面主要现象进行研究的科学;是研究人与计算机之间通过相互理解的交流与通信,在最大程度上为人们完成信息管理,服务和处理等功能,使计算机真正成为人们工作学习的和谐助手的一门技术科学。

它包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,及其人通过输入设备给机器发出命令、回答问题等。简单地说,“交互”,就是指人与设备、系统、网站等的直接或间接的通信过程。人机交互涉及到计算机科学技术、心理学、社会学、人机工程学、工业设计以及语言学等多门学科[1]。

其前景可通过Dan R.Olsen(CMC)得到体现:“HCI是未来的计算机科学。我们已经花费了至少50年的时间来学习如何制造计算机以及如何编写计算机程序。下一个

新领域自然是让计算机服务并适应于人类的需要,而不是强近人类去适应计算机。”也就是说人机交互技术能真正实现人机融合,体现出以人为本的理念。

2.2 人机交互的发展历史

人机交互作为计算机系统的一个重要组成部分,人机交互一直伴随着计算机的发展而发展。人机交 互的发展过程,也是人适应计算机到计算机不断地适应人的发展过程。从计算机的诞生之日起,人机交互技术的发展已经经历了三个阶段:

2.2.1 语言命令交互阶段

早期的人机交互是通过命令语言进行的,人机之间通过语言中的输入输出功能完成交互。最初,人机交互的方式是采用手工操作输入机器语言指令(二进制机器代码)来控制计算机。这一阶段所使用的主要交互工具是键盘及字符显示器,交互的内容主要有字符、文本和命令,交互过程显得呆板和单调。

这种形式很不符合人的习惯,既耗费时间,又容易出错,只有非常专业的专家才能做到。后来,出现了FORTRAN 、PASCAL 、COBOL 等语言,使人们可以用比较习惯的符号形式描述计算过程,交互操作由受过一定训练的程序员即可完成。这一时期,程序员可采用批处理作业语言或交互命令语言的方式和计算机打交道,虽然要记忆许多命令和熟练地敲键盘,但已可用较方便的手段来调试程序、了解计算机执行情况。

60年代中期,命令行界面(Command Line Interface ,CLI )开始出现(如图1),通过这种人机界面,人们可以通过问答式对话、文本菜单或命令语言等方式来进行人机交互。命令行界面可以看作第一代人机界面。在这种界面中,人被看成操作员,机器只做出被动的反应,人只能用手操作键盘的方式输入数据和命令信息,界面输出只能为静态字符。因此,这种人机界面交互的自然性较差。

2.2.2 图形用户界面(GUI )交互阶段

70年代施乐公司在Alto 计算机上首次开发了位映像图形显示技术,为开发可重叠窗口、弹出式菜单、菜单条等提供了可能。这些工作奠定了目前图形用户界面的基础,形成了以窗口(Windows )、图标(Icon )、菜单(Menu )和指点装置(Pointing Device )为基础的第二代人机界面,即WIMP 界面。图形用户界面(Graphical User Interface ,GUI )的出现,使人机交互方式发生了巨大变化。GUI 的主要特点是桌面隐喻、WIMP(Windows 、Icon 、Menu 、Pointing Device)技术、直接操纵和“所见即所得(What You See Is What You Get ,WYSIWYG )”。GUI 技术的起源可以追溯到60年代美国麻省理工学院的Sutherland(计算机图形学的奠基人)的工作。其发明的Sketchpad

首次引入了菜单、不可重叠的瓦片式窗口、图标,并采用光笔进行绘图1 命令行界面概念模型

图操作。

图2 WIMP界面概念模型

这一阶段所使用的主演交互工具为鼠标及图形显示器,交互的内容主要有字符、图形和图像。70年代发明的鼠标极大地改善了人机之间的交互方式。应该说,鼠标和窗口系统的出现是人机交互技术发展史上的一次技术革命。

与命令行界面相比,图形用户界面的人机交互自然性和效率都有较大的提高。图形用户界面很大程度上依赖于菜单选择和交互小组件(Widget)。经常使用的命令大都通过鼠标来实现。鼠标驱动的人机界面使得初学者易于使用,但重复性的菜单选择会给有经验的用户造成不方便,他们有时倾向使用命令键而不是选择菜单,且在输入信息时用户只能使用手这一种输入通道。另外,图形用户界面需要占用较多的屏幕空间,并且难以表达和支持非空间性的抽象信息的交互。

2.2.3 自然和谐的人机交互阶段

当前,虚拟现实、移动计算、普适计算等技术的飞速发展,对人机交互技术提出了新的挑战和更高的要求,同时也提供了许多新的机遇。在这一阶段,自然和谐的人机交互方式得到了一定的发展。基于语音、手写体、姿势、视线跟踪、表情等输入手段的多通道交互是其主要特点,其目的是使人能以声音、动作、表情等自然方式进行交互操作。

在自然和谐的人机交互的发展过程中,人们除了致力于研究开发友好的逼真的三维用户界面,基于声音、动作、表情等多种通道的自然交互方式,还发明了大量的新交互设备,如计算机图形学的先驱、美国麻省理工学院的Sutherland早在1968年开发了头盔式立体显示器,成为现代虚拟现实技术的重要基础。

目前,对于人类重要的自然交互方式——语音和笔的交互技术,包括手写识别、笔式交互、语音识别、语音合成、数字墨水(Digital Ink)等,其发展已经有了很大的成效,而人机自然交互的主要包括了多通道用户界面;智能人机交互;感知人机交互和多媒体人机交互等[2]。

图3 多通道人机界面概念模型

2.3 人机交互与其他学科的关系

由上述人机交互的概念可知:人机交互与很多学科密切相关,而其中,认知心理学与人机工程学是人机交互技术的理论基础,而多媒体技术和虚拟现实技术与人机交互技术相互交叉和渗透,其关系如图4所示。

2.3.1 认知心理学

认知心理学(Cognitive Psychology )是

20世纪50年代中期在西方兴起的一种心理学思潮,在20世纪70年代成为西方心理学的一个主要研究方向。它研究人的高级心理过程,主要是认识过程,如注意、知觉、表象、记忆、思维和语言等,从心理学的观点研究人机交互的原理[3]。该领域研究包括如何通过视觉、听觉等接受和理解来自周围环境的信息的感知过程,以及通过人脑进行记忆、思维、推理、学习和解决问题等人的心理活动的认识过程。其中人脑的认知模型——神经元网络及其模型,已经成为新一代计算机、人工智能等领域中最热门的研究课题之一。认知心理学在人机界面设计方面具有非常重要作用,是人机交互技术的重要理论基础。

2.3.2 人机工程学

人机工程学是运用生理学、心理学和医学等有关知识,研究人、机器、环境相互间的合理关系,以保证人们安全、健康、舒适地工作,从而提高整个系统工效的新兴边缘科学。在人机界面学处于初创和奠基阶段的时候,人机工程学是最活跃、最主要的分支,曾经对人机界面学的发展做出过很大的贡献。经典的人机工程学称图4 人机交互与其他相关学科的关系

为硬件人机工程学,主要集中在对人体能力、人体限制及其他与设计相关的人体特性信息的应用,以满足设计、分析、测试与评价、标准化,以及系统控制的要求。软件人机工程学(Software Ergonomics)研究软件和软件界面,侧重于运用和扩充软件工程的理论和原理,对软件人机界面进行分析、描述、设计和评估等。

主要解决有关人类思维与信息处理的有关问题,包括设计理论、标准化、增强软件的可用性的方法等,使软件(计算机)与人的对话能够满足人的思维模式与数据处理的要求,实现软件的高可用性。同认知心理学一样,人机工程学也是人机交互技术的重要理论基础。

2.3.3 多媒体技术

一般的,多媒体技术是指将正文、声音、图形、静止图像、动态图像等与计算集成在一起的技术。多媒体技术通过引入动画、音频、视频等动态媒体,大大丰富了计算机表现信息的形式,拓宽了计算机输出的带宽,提高了用户接受信息的效率,使人们可以得到更直观的信息,从而简化了用户的操作,扩展了应用范围。

多媒体信息在人机交互中的巨大潜力主要在于它能提高人对信息表现形式的选择和控制能力,同时也能提高信息表现形式与人的逻辑和创造能力的结合程度,在串行、符号信息以及并行、联想信息方面扩展人的信息处理能力。

另外,由于多媒体所带来的信息冗余性,重复使用别的媒体或并行使用多种媒体可消除人机通信过程中的多义性及噪声。多媒体技术丰富了信息的表现形式,不过目前多媒体技术的研究基本上限于信息的存储和传输方面,而对于媒体信息理解的研究并不充分。与人工智能技术结合,开展媒体理解和推理研究将改变这种现状。

它对用户的原始输入在较高的层次上进行解释、分析和综合,提取语义内容,达到对用户的某种理解。然后,从较高的表现层次上传达给用户最恰当的反馈,它侧重于信息的理解和解释。而多媒体系统则侧重于信息的表现,表现为在计算机的控制下产生、操纵、表现、存储和传送—些独立的信息,这些信息至少是通过一种连续或离散媒体进行编码的。

2.3.4 虚拟现实技术

目前,人们除了致力于研究开发友好的用户界面,还发明了大量的三维交互设备,如立体眼镜、WorkBench、头盔式显示器、洞穴式立体显示器(CAVE)、墙式大屏幕立体显示器、数据服装、位置跟踪器、眼动跟踪器、触觉和力反馈装置、三维扫描设备、三维鼠标、三维跟踪球、三维游戏杆、数据手套等[3]。

虚拟现实中的交互是虚拟现实核心研究内容之一,但人机交互并不是虚拟现实的全部,复杂场景的建模、绘制等技术,也是虚拟现实非常重要的研究内容。虚拟现实为人机交互的研究提供了很好的契机和媒介,但并不是唯一的媒介,手机、PDA、笔记本电脑等移动设备,也需要更方便、快捷、人性化的交互手段。

3 人机交互的研究内容

人机交互的研究内容十分广泛,涵盖了建模、设计、评估等理论和方法以及在Web、移动计算、虚拟现实等方面的应用研究与开发,主要包括:

3.1 人机交互界面表示模型与设计方法(Model and Methodology)

为了设计人机交互界面模型,首先我们的了解何为人机交互的要素,人机交互技术主要由人的因素、交互设备和交互软件三方面组成。人机交互技术又可分为精确人机交互技术和非精确交互技术。前者是指:能完全地说明人—机交互的目的,系统能精确地确定用户的输入、键盘、鼠标、触摸屏都是能精确交互设备。后者的方法有语音、姿势、头部追踪等。

人机交互界面作为计算机系统的一个重要组成部分,是计算机科学、认知心理学等的交叉研究领域。人机交互界面也叫用户界面,在人机系统中的位置是负责管理计算机的输入和输出,它决定了人们使用计算机的方式[4]。

3.2 可用性分析与评估(Usability and Evaluation)

可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。人机交互系统的可用性分析与评估的研究主要涉及到支持可用性的设计原则和可用性的评估方法等。

3.3 多通道交互技术(Multi-Modal)

在多通道交互中,用户可以使用语音、手势、眼神、表情等自然的交互方式与计算机系统进行通信。多通道交互主要研究多通道交互界面的表示模型、多通道交互界面的评估方法以及多通道信息的融合等。通道包括人表达意图,执行动作和感知反馈信息的各种通信方法。

3.4 认知与智能用户界面(Recognition and Intelligent User Interface)

智能用户界面(Intelligent User Interface,IUI)的最终目标是使人机交互和人-人交互一样自然、方便。上下文感知、眼动跟踪、手势识别、三维输入、语音识别、表情识别、手写识别、自然语言理解等都是认知与智能用户界面需要解决的重要问题。

3.5 虚拟环境(Virtual Environment)中的人机交互

“以人为本”的、自然和谐的人机交互理论和方法是虚拟现实的主要研究内容之一。通过研究视觉、听觉、触觉等多通道信息融合的理论和方法、协同交互技术以及三维交互技术等,建立具有高度真实感的虚拟环境,使人产生“身临其境”的感觉[6]。

3.6 Web设计(Web-Interaction)

重点研究Web界面的信息交互模型和结构,Web界面设计的基本思想和原则,Web 界面设计的工具和技术,以及Web界面设计的可用性分析与评估方法等内容。

3.7 移动界面设计(Mobile and Ubicomp)

移动计算(Mobile Computing)、普适计算(Ubiquitous Computing)等对人机交互技术提出了更高的要求,面向移动应用的界面设计问题已成为人机交互技术研究的一个重要应用领域。针对移动设备的便携性、位置不固定性和计算能力有限性以及无线网络的低带宽高延迟等诸多的限制,研究移动界面的设计方法,移动界面可用性与评估原则,移动界面导航技术,以及移动界面的实现技术和开发工具,是当前的人机交互技术的研究热点之一。

其中普适计算也称为无所不在的计算,它所追求的目标是无所不在的信息访问和信息服务,它的物质基础是无处不在的设备和无所不在的网络连接。

3.8 群件(Groupware)

群件是指帮助群组协同工作的计算机支持的协作环境,主要涉及个人或群组间的信息传递、群组中的信息共享、业务过程自动化与协调,以及人和过程之间的交互活动等。目前与人机交互技术相关的研究主要包括:群件系统的体系结构、计算机支持交流与共享信息的方式、交流中的决策支持工具、应用程序共享以及同步实现方法等内容。

4 发展趋势

从命令行界面发展到WIMP界面,计算机到用户的输出带宽得到大幅提高,但是从用户到计算机的通信带宽仍然受到限制,即计算机呈现和加工视觉、听觉信息的

能力与人机交互的能力是不相称的。这种不相称来自于硬件的限制和人的交互通道与对象操作间的不匹配。近年来,计算机输入输出装置在数量和能力上迅速增加,使得这种匹配成为可能。为适应目前和未来计算机系统的要求,人们开始探索各种非传统的用户界面从90年代初开始,研究者们将研究的焦点重新聚集到下一代用户界面的研究上,并且提出了人机自然交互的模型[6]。在未来的计算机系统中,将更加强调“以人为本”、“自然、和谐”的交互方式,以实现人机高效合作。

4.1 集成化

人机交互将呈现出多样化、多通道交互的特点。桌面和非桌面界面,可见和不可见界面,二维与三维输入,直接与间接操纵,语音、手势、表情、眼动、唇动、头动、肢体姿势、触觉、嗅觉、味觉以及键盘、鼠标等交互手段将集成在一起,是新一代自然、高效的交互技术的一个发展方向。

4.2 网络化

无线互联网、移动通信网的快速发展,对人机交互技术提出了更高的要求。新一代的人机交互技术需要考虑在不同设备、不同网络、不同平台之间的无缝过渡和扩展,支持人们通过跨地域的网络(有线与无线、电信网与互联网等)在世界上任何地方用多种简单的自然方式进行人机交互,而且包括支持多个用户之间以协作的方式进行交互。另外,网格技术的发展也为人机交互技术的发展提供了很好的机遇。

4.3 智能化

目前,用户使用键盘和鼠标等设备进行的交互输入都是精确的输入,但人们的动作或思想等往往并不很精确,人类语言本身也具有高度模糊性,人们在生活中常常习惯于使用大量的非精确的信息交流。因此,在人机交互中,使计算机更好地自动捕捉人的姿态、手势、语音和上下文等信息,了解人的意图,并做出合适的反馈或动作,提高交互活动的自然性和高效性,使人-机之间的交互像人-人交互一样自然、方便,是计算机科学家正在积极探索的新一代交互技术的一个重要内容。

4.4 标准化

目前,在人机交互领域,ISO已正式发布了许多的国际标准,以指导产品设计、测试和可用性评估等。但人机交互标准的设定是一项长期而艰巨的任务,并随着社会需求的变化而不断变化。

此外,我们还得增强现实中的人机交互,因为虚拟现实技术目的是给使用者完全虚拟的沉浸感,将使用者与真实直接隔离开来,而增强现实 (AugmentedReality)不是把使用者与真实世界隔离开,是将计算机生成的虚拟物体或其它信息叠加到真实场景中,从而实现对现实世界的增强它的主要内容有虚实结合、实时交互和三维注册[5]。

5 结束语

随着计算机软、硬件技术的发展,特别是交互式3D图形技术的进一步成熟,以虚拟现实为代表的三维交互(即人机自然交互)系统得到越来越多的应用,人机自然交互界面正在成为人机交互技术的一个重要发展方向。并且对计算机的发展和应用起到了巨大的推动作用。

目前,正在努力探索追求“人机和谐”的多位信息空间和“基于自然交互方式的”的人机交互风格中,人机自然交互技术与现有的二维WIMP界面有很大不同,在带来更自然的交互方式和有效拓展人机通信带宽的同时,也面临着许多新的设计挑战和更复杂的可用性问题,存在着很多关键技术需要攻关,正因为如此,才给我国的科研工作者带来了诸多的机遇和挑战。

参考文献

[1]吴秀玲.浅析多媒体人机交互技术[J].中国现代教育装备;2008,(09).

[2]林粤江;;浅谈人机交互技术[J];黑龙江科技信息;2007,(07).

[3]曾芬芳等.虚拟现实技术[M].上海:上海交通大学出版社,1997.

[4]王亮.虚拟环境中基于语义的三维交互技术研究及应用[D].中国科学技术大学,2008.

[5]李杨.三维人机交互系统中的若干关键技术研究[D].浙江大学,2011.

[6]Professor Dr.-Ing. Karl-Friedrich Kraiss.Advanced Man-Machine Interaction.RWTH Aachen

University,2006.

人机交互技术的发展与现状

人机交互技术的发展与现状 一.什么是人机交互技术? 二.人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、 输出设备,以有效的方式实现人与计算机对话的技术。人机交互技术包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题及提示请示等。人机交互技术是计算机用户界面设计中的重要内容之一。它与认知学、人机工程学、心理学等学科领域有密切的联系。也指通过电极将神经信号与电子信号互相联系,达到人脑与电脑互相沟通的技术,可以预见,电脑甚至可以在未来成为一种媒介,达到人脑与人脑意识之间的交流,即心灵感应。二. 人机交互技术的发展人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。 1959年美国学者B.Shackel从人在操纵计算机时如何才能减轻疲劳出发,提出了被认为是人机界面的第一篇文献的关于计算机控制台设计的人机工程学的论文。1960年,Liklider JCK首次提出人机紧密共栖(Human-Computer Close Symbiosis)的概念,被视为人机界面学的启蒙观点。1969年在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业杂志国际人机研究(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。在1970年成立了两个HCI研究中心:一个是英国的Loughbocough大学的HUSAT研究中心,另一个是美国Xerox公司的Palo Alto研究中心。 1970年到1973年出版了四本与计算机相关的人机工程学专着,为人机交互界面的发展指明了方向。 20世纪80年代初期,学术界相继出版了六本专着,对最新的人机交互研究成果进行了总结。人机交互学科逐渐形成了自己的理论体系和实践范畴的架构。理论体系方面,从人机工程学独立出来,更加强调认知心理学以及行为学和社会学的某些人文科学的理论指导;实践范畴方面,从人机界面(人机接口)拓延开来,强调计算机对于人的反馈交互作用。人机界面一词被人机交互所取代。HCI中的I,也由Interface(界面/接口)变成了Interaction(交互)。人机

人机交互的未来论文(精)

虚拟的现实 ----人际交互的未来 序言:回顾人类的历史,人类生存空间中的信息最开始是存贮在纸张、大脑、物体等介质上。是计算机构建了一个01空间,它像一个有强大引力的黑洞,将人类生存空间中的各式各样的信息都逐渐吸进去变成010101,黑洞用这些010101通过一些基本运算产生新的010101, 并可将这些010101组成一些虚构的图象呈现在人们面前,甚至将人类生存的世界也开始建成010101的代码. 人机交互研究已经历了两个界限分明的时代,第一代是以文本为基础的交互, 如菜单、命令、对话等,难用且不灵活。第二代则是直接操作界面,它引出更自然的视觉通信交互。是交互多媒体集成方法,需要大量使用语言,自然语言和高级图形,也可使用其它交互媒体,如人的动作、手势和三维图像等. 随着虚拟技术的发展,在某一天图形用户界面也会被新的虚拟界面淘汰,新一代的用户界面将向用户提供身临其境和多感觉通道体验,在你烦恼的时候,想吹海风、听海浪、看雪山、小桥流水、将卧室的窗户推开,而不论你在哪里!计算机都将会为你完成这一切,计算机模拟人类感觉的世界而生成一种世界,这里的“世界”是指具有真实感的立体图形,它既可以是某种特定现实世界的真实再现,也可以是纯粹构想的世界。操作者可以通过视觉、听觉、触觉、力觉等与之交互,从而能产生“身临其境”场景. 简介:这种虚拟的现实是以用户对界面的需求变化为出发点,使用户界面的外在形式和内部机制能符合不同用户的需要,这就是以用户为中心的设计思想。非特定人的连续语音识别技术将使计算机能理解人们的要求,是一种重要的输入界面和手段。现在我们已经有的鱼眼技术使屏幕观察(或光标位置附近的内容被放大,便于用户观察。在传统的人机系统中,人被认为是操作者,人去适应机器;在一般的人机系统中,人被称为用户,能与机器对话,但无主动控制能力;而在虚拟现实系统中,人才是主动的参与者,机器将对人的各种动作做出反应。

回顾:人机交互中的手势的可视化解释

本科毕业设计(论文) 外文参考文献译文及原文 学院机电工程学院 专业数字媒体技术 年级班别2008级(1)班 学号3109000746 学生姓名李林钢 指导教师冯开平 2013年6 月

目录 译文:回顾:人机交互的手势的可视化解释 (1) 1 引言 (1) 2手势建模 (3) 2.1定义手势 (3) 2.2手势分类 (5) 2.3 手势的暂时性模型 (5) 2.4空间建模手势 (6) 3手势分析 (7) 原文: Visual Interpretation of Hand Gestures for Human-Computer Interaction: A Review(见同名文献) .................................................. 错误!未定义书签。 1 INTRODUCTION .......................................................................... 错误!未定义书签。 2 GESTURE MODELING ................................................................ 错误!未定义书签。 2.1 Definition of Gestures .......................................................... 错误!未定义书签。 2.2 Gestural Taxonomy ............................................................... 错误!未定义书签。 2.3 Temporal Modeling of Gestures ........................................... 错误!未定义书签。 2.4 Spatial Modeling of Gestures ............................................... 错误!未定义书签。 3 GESTURE ANAL YSIS ..................................................................................... 错误!未定义书签。

谈谈自己对人机交互的认识

中南林业科技大学课程论文谈谈自己对人机交互系统的认识 注:对号:正确、完整、详细、合理 半对号:部分正确、不完整、不详细、基本合理 错号:错误、缺失、较差 抄袭一票否决

谈谈自己对人机交互的认识 人机交互界面作为一个独立的、重要的研究领域受到了世界各计算机厂家的关注。并成为90年代计算机行业的又一竞争领域。从计算机系统的发展过程来看,人机交互界面技术还引导了相关软硬件技术的发展,是新一代计算机系统取得成功的保证。80年代已来,计算机的软件和硬件技术取得了较大的发展,同时,计算机的使用者也从计算机专家迅速扩大到了广大未受过专门训练的普通用户,由此极大地提高了用户界面在系统设计和软件开发中的重要性,强烈地刺激了人机交互界面的进步。人-计算机的交互作用是通过用户界面来实现的。 我国在人机界面方面的设计与国际同类研究相比还存在较大差距。目前的研究仅仅着重于支持界面的软件和硬件,对界面本身还缺少深入的研究,用户界面的设计还没有成为软件设计中独立的一部分,也缺少新的人机界面设计技术。而另一方面,计算机科学的发展和计算机的普及应用却对人机界面的研究提出了越来越高的要求。 进入九十年代计算机软件开发已进入了以开发软件工具和建立软件开发环境为目标的时代。作为支持人机交互软件开发环境的用户界面管理系统UIMS正日益受到人们的关注和重视。今后UIMS将有可能进入各类实际软件开发环境,成为继DBMS之后的又一个重要的软件开发环境和工具。 根据当前发展情况,大概有一个现状和一个趋势能看得到,拿来和大家分享一下。HCI是偏向应用的,本质上还是多学科交叉的工程应用技术领域。从商业应用来看,HCI能做的方面有:软件、硬件、交互环境、互联网、生活应用、集成交互系统等。简单举例:软件,包括优良综合(功能)应用体验和用户界面硬件,包括脑波仪器、眼动仪、感应器(sensor)、移动通讯设备、信息终端、通用电子数码产品、等交互环境,如虚拟现实、三维模拟场景、民用交通工具驾驶环境、军用飞行器/车辆/设备操纵环境、等互联网,包括网站的设计和功能,用户体验的提升和评估,网络产品的用户体验,互联网与通讯网与人际网络的重合研究,等生活应用,包括智能住宅(Smart Home),以及一些家用装备的交互功能和体验设计集成交互系统,如车站港口机场的信息导航设计、功能和体验设计评估与监控,大型复杂操作环境的体系交互设计与评估等其实能做的特别多,当然成就与否在于我们有怎样的思路和做法,这还需要大量的实践来检验。 一个趋势就是,在未来的HCI领域,有可能会分化出这样几个主干方向:1.硬件设备,包括眼动仪、脑波仪、感应仪器、评测仪器、以及能够参与和辅助HCI研究与实践的装备 2.人文研究,毕竟HCI的终极目标是人类好的体验最大化,所有的分支和应用都离不开对用户的研究,所以研究使用者以及文化影响,甚至包括在三重网络(互联网、通讯网、人际关系网)逐渐重叠的趋势下一些新的演变和背后的本质等等 3.还一个就是设计方向,这主要集中在综合的用户体验设计,以及应用产品、服务的具体设计,还包括对设计的理论研究、与HCI其他因素的结合、框架体系、监测评估、流程方式、工具和方法等等。 在一个交互系统中,由于操作者的个人原因,经常会产生误操作,包括键入错误、数据输入错误等。同样,在用户编制的程序或设备连接时也可能会

人机交互发展历史

人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。交互的信息也由精确的输入输出信息变成非精确的输入输出信息。 一、简单的人机交互界面 由于受到制造技术和成本等原因限制,早期的人机交互在设计上较少考虑人的因素,一味强调输入输出信息的精确性,因而使用不够自然和高效。 1.早期的手工作业。 当时交互的特点是由设计者本人(或本部门同事)来使用计算机,他们采用手工操作和依赖机器(二进制机器代码)的方法去适应现在看来是十分笨拙的计算机; 2.作业控制语言及交互命令语言。 这一阶段的特点是计算机的主要使用者—程序员可采用批处理作业语言或交互命令语言的方式和计算机打交道,虽然要记忆许多命令和熟练地敲键盘,但已可用较方便的手段来调试程序、了解计算机执行情况; 3.图形用户界面(GUI)。 GUI的主要特点是桌面隐喻、WIMP技术、直接操纵和“所见即所得(WYSIWYG)”。由于GUI简明易学、减少了敲键盘、实现了“事实上的标准化”。因而使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群。它的出现使信息产业得到空前的发展; 4.网络用户界面。 以超文本标记语言HTML及超文本传输协议HTTP为主要基础的网络浏览器是网络用户界面的代表。由它形成的WWW网已经成为当今Internet的支柱。这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、网络加速、多媒体动画、聊天工具等; 二、自然的人机交互界面 随着网络的普及性发展和无线通讯技术的发展,人机交互领域面临着巨大的挑战和机遇,

传统的图形界面交互已经产生了本质的变化,人们的需求不再局限于界面的美学形式的创新,现在的用户更多的希望在使用多媒体终端时,有着更便捷、更符合他们的使用习惯,同时又有着比较美观的操作界面。利用人的多种感觉通道和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,使人们从传统的交互方式的束缚解脱出来,使人们进入自然和谐的人机交互时期。这一时期的主要研究内容包括:多通道交互、情感计算、自然语言理解、虚拟现实、智能用户界面等方面。 (1)多通道交互 多通道交互(Multi Modal Interaction,MMI)是近年来迅速发展的一种人机交互技术,它既适应了“以人为中心”的自然交互准则,也推动了互联网时代信息产业(包括移动计算、移动通信、网络服务器等)的快速发展。MMI是指“一种使用多种通道与计算机通信的人机交互方式。通道(modality)涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如言语、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉或味觉等”。采用这种方式的计算机用户界面称为“多通道用户界面”。目前,人类最长使用的多通道交互技术包括手写识别、笔式交互、语音识别、语音合成、数字墨水、视线跟踪技术、触觉通道的力反馈装置、生物特征识别技术和人脸表情识别技术等方面。 (2)情感计算 让计算机具有情感能力首先是由美国MIT大学Minsky教授(人工智能创始人之一)提出的。他在1985年的专著“The Society of Mind”中指出,问题不在于智能机器能否有任何情感,而在于机器实现智能时怎么能够没有情感。从此,赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著“Affective Computing(情感计算)”中提出并给出了定义,即情感计算是关于情感、情感产生以及影响情感方面的计算。 MIT对情感计算进行全方位研究,正在开发研究情感机器人,最终有可能人机融合。其媒体实验室与HP公司合作进行情感计算的研究。IBM公司的“蓝眼计划”,可使计算机知道人想干什么,如当人的眼瞄向电视时,它竟知道人想打开电视机,它便发出指令打开电视机。此外该公司还研究了情感鼠标,可根据手部的血压及温度等传感器感知用户的情感。CMU 主要研究可穿戴计算机。日本在对感性信息处理的研究中,有众多研究单位参与,主要集中在研究所和高校。特别值得一提的是,日本欧姆龙公司研制生产的机器玩具曾风行一时,最

仿生机器人关键技术

仿生机器人关键技术 “仿生机器人”是指模仿生物、从事生物特点工作的机器人。,涉及到机械设计、计算机、传感器、自动控制、人机交互、仿生学等多个学科。因此,机器人领域中需要研究的问题非常多。主要研究问题包括以下五个方面: 1 建模问题 仿生机器人的运动具有高度的灵活性和适应性。其一般都是冗余度或超冗余度机器人,结构复杂,运动学和动力学模型与常规机器人有很大差别,且复杂程度更大。为此,研究建模问题,实现机构的可控化是研究仿生机器人的关键问题之一。 2 控制优化问题 机器人的自由度越多,机构越复杂,必将导致控制系统的复杂化。复杂巨系统的实现不能全靠子系统的堆积,要做到整体大于组分之和,同时要研究高效优化的控制算法才能使系统具有实时处理能力。 3 信息融合问题 在仿生机器人的设计开发中,为实现对不同物体和未知环境的感知,都装备有一定量的传感器。多传感器的信息融合技术是实现其具有一定智能的关键。信息融合技术把分布在不同位置的多个同类或不同类的传感器所提供的局部环境的不完整信息加以综合,消除多传感器信息之间可能存在的冗余和矛盾,从而提高系统决策、规划、反应的快速性和正确性。 4 机构设计问题 合理的机构设计是仿生机器人实现的基础。生物的形态经过千百万年的进化,其结构特征极具合理性,而要用机械来完全仿制生物体几乎是不可能的,只有在充分研究生物肌体结构和运动特性的基础上提取其精髓进行简化,才能开发全方位关节机构和简单关节组成高灵活性的机器人机构。 5 微传感和微驱动问题 微型仿生机器人有些已不是传统常规机器人的按比例缩小,它的开发涉及到电磁、机械、热、光、化学、生物等多学科。对于微型仿生机器人的制造,需要解决一些工程上的问题,如动力源、驱动方式、传感集成控制以及同外界的通讯等。实现微传感和微驱动的一个关键技术是机电光一体结合的微加工技术。同时,在设计时必须考虑到尺寸效应、新材料、新、工艺等问题。

人机交互技术及其应用科普_百度文库

人机交互技术及其应用(科普) 信息技术的高速发展对人类生产、生活带来了广泛而深刻的影响。高科技成果为人们带来便捷、快乐的同时,也促进着人机交互技术的发展。作为信息技术的重要内容,人机交互技术比计算机硬件和软件技术的发展要滞后许多,已成为人类运用信息技术深入探索和认识客观世界的瓶颈。因此,人机交互技术已成为21世纪信息领域亟需解决的重大课题和当前信息产业竞争的一个焦点,世界各国都将人机交互技术作为重点研究的一项关键技术,例如,在美国21世纪信息技术计划中,将软件、人机交互、网络、高性能计算列为基础研究内容,美国国防关键技术计划也把人机交互列为软件技术发展的重要内容之一,在我国的“863”、“973”和自然科学基金等项目中,也将人机自然交互理论与方法作为信息技术中需要解决的关键科学问题。 一、人机交互的概念 人机交互(Human-Computer Interaction,HCI)是关于设计、评价和实现供人们使用的交互式计算机系统,且围绕这些方面主要现象进行研究的科学,狭义的讲,人机交互技术主要是研究人与计算机之间的信息交换,它主要包括人到计算机和计算机到人的信息交换两部分。人们可以借助键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等设备,用手、脚、声音、姿势或身体的动作、眼睛甚至脑电波等向计算机传递信息,同时,计算机通过打印机、绘图仪、显示器、头盔式显示器、音箱等输出或显示设备给人提供信息。人机交互与计算机科学、人机工程学、多媒体技术和虚拟现实技术、心理学、认知科学和社会学以及人类学等诸多学科领域有密切的联系,其中,认知心理学与人机工程学是人机交互技术的理论基础,而多媒体技术和虚拟现实技术与人机交互技术相互交叉和渗透。作为是信息技术的一个重要组成部分,人机交互将继续对信息技术的发展产生巨大的影响。 二、人机交互的研究内容 人机交互的研究内容十分广泛,涵盖了建模、设计、评估等理论和方法以及在移动计算、虚拟现实等方面的应用研究与开发,在此列出几个主要的方向:人机交互界面表示模型与设计方法(Model and Methodology) 一个交互界面的好坏,直接影响到软件开发的成败。友好人机交互界面的开发离不开好的交互模型与设计方法。因此,研究人机交互界面的表示模型与设计方法,是人机交互的重要研究内容之一。 可用性分析与评估(Usability and Evaluation) 可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。人机交互系统的可用性分析与评估的研究主要涉及到支持可用性的设计原则和可用性的评估方法等。

人机交互论文

浅谈人机交互技术 一.概述 自计算机以一个庞然大物的笨拙体态出现直到现在,它已经越来越紧密地融入了人们的日常生活,并已经被公认为解决医疗、教育、科研、环保等各类重大社会问题不可或缺的重要工具。随着技术的飞速发展,人们在自然语言理解、多通道交互、笔式交互以及智能用户界面等方面开展了很多工作。由于计算机科学发展水平的限制、在计算机和人类之间还存在一条鸿沟。人机交互( Human Computer Interaction,HCI)。就是连接人和计算机的桥梁,它使人和机器的关系已从“人围着机器转”向“机器围着人转”的方向发展,变得更加自然、和谐。 人机交互是研究人与计算机之间通过相互理解的交流与通信,在最大程度上为人们完成信息管理,服务和处理等功能,使计算机正真成为人们工作学习的和谐助手的一门技术科学。鉴于它对科技发展的重要性,研究如何实现自然,便利和无所不在的人机交互,成为现代信息技术,人工智能技术研究的至高目标,也是数学,信息科学,智能科学,神经科学,以及生理、心理科学多科学交叉的新结合点,并将引导着二十一世纪前期信息和计算机研究的热门方向。 1.2人机交互的发展历程 人机交互作为计算机科学研究领域中一个重要组成部分,其发展历程已经经历了半个多世纪,并且取得了很大的进步和提高。从计算机的诞生之日起,人机交互技术的发展已经经历了三个阶段:命令语言界面:这一阶段所使用的主要交互工具为键盘及字符显示器,交互的内容主要有字符、文本和命令,交互过程显得呆板和单调。图形用户界面:这一阶段所使用的主要交互工具为鼠标及图形显示器,交互的内容主要有字符、图形和图像。70年代发明的鼠标,极大地改善了人机之间的交互方式。应该说,鼠标和窗口系统的出现,是人机交互技术发展历史上的一次技术革命。自然人机交互:多通道用户界面;智能人机交互;感知人机交互;多媒体人机交互等。

人机交互的发展历程及产业链分析

一、人机交互概念 人机交互(Human-ComputerInteraction,HCI)主要是研究用户与系统之间的信息交换,它主要包括用户到系统和系统到用户的信息交换两部分。系统可以是各种各样的机器,也可以是智能电视机、智能手机以及计算机系统和软件。用户可以借助操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等各类穿戴设备,用手势、声音、姿势或身体的动作、眼睛甚至脑电波等向系统传递信息,同时,系统通过各类机器、显示器、音箱等输出或显示设备给人提供信息。 理想状态下,人机交互将不再需要依赖机器语言,在没有键盘、鼠标以及触摸屏等中间设备的情况下,实现随时随地实现人机的自由交流。从而实现人们的物质世界和虚拟网络的最终融合。 从本质上,人机交互技术是一个典型的模式识别问题,智能机器通过多种传感器,获取人的表情、姿态、手势、语音、语调、血压、心率等各种数据,结合当时的环境、语境、情境等上下文信息,识别和理解用户的情感。这包括传感器技术、计算机科学、认知科学、人机工程学、多媒体技术和虚拟现实技术、心理学、哲学以及人类学等诸多学科领域有密切的联系。 二、人机交互产业链 从人机交互过程来讲,可分为四步:通过传感器直接或间接与人接触获得感知信息;通过建立模型对感知信息进行分析与识别;对分析结果进行推理达到感性的理解;将理解结果通过合理的方式表达出来。也就完成了人机交互的全过程。 从功能实现看,人机交互作为一个闭环的模式识别系统,应该包括感知信号的获取、感知信息的分析与识别、感知信息的理解和信息表达等功能四个环节,当感知信息与标准信息存在差异时,将发出指令给予修正或反馈信息给予告警和提示。在这四个方面的环节中,感知信息的识别和感知信息的理解是核心技术的关键所在。 从技术实现过程看,信息获取和信息识别环节属于感知层的范畴,而感知信息的理解和信息表达属于应用层的内容。体感设备实现信息的获取,而嵌入芯片实现体感信号的模式识别,然后通过后台计算机或分布式计算平台建立数学模型、实现强大的运算系统,实现感知信息的理解(理解用户姿态或手势的真实目的),最后转入应用层,调用相关应用程序,满足用户的最终需求。

(完整word版)第五代移动通信的关键技术

第五代移动通信的关键技术 5G 是面向未来的通信发展需求的移动通信系统,第五代移动通信技术兴起的主要驱动力为互联网和物联网,将来人机交互和数据共享是人们日常生活的一部分,在这种交互下,人们的生活将会更加高效舒适。第五代移动通信系统不仅通信容量大,速率高,其可靠性和安全性也比第四代移动通信有了更好的改进,具有很大的发展空间,下面简单介绍几种第五代移动通信的关键技术。 1.Massive MIMO技术 大规模MIMO技术是指基站端采用大规模天线阵列,天线数超过十根甚至上百根,并且在同一时频资源内服务多个用户的多天线技术。大规模MIMO技术将传统的时域、频域、码域三维扩展为了时域、频域、码域、空域四维,新增维度极大的提高了数据传输速率。大规模MIMO天线技术提供了更强的定向能力和赋形能力如图1,大规模MIMO的空间分辨率与现有MIMO相比显著增强,能深度挖掘空间维度资源,使得网络中的多个用户可以在同一时频资源上利用大规模MIMO提供的空间自由度与基站同时进行通信,从而在不需要增加基站密度和带宽的条件下大幅度提高频谱效率。大规模MIMO可将波束集中在很窄的范围内,从而大幅度降低干扰,大幅降低发射功率,从而提高功率效率,减少用户间干扰,显著提高频谱效率。 当基站侧天线数远大于用户天线数时,各个用户的信道将趋于正交,小区内同道干扰及加性噪声趋于消失,系统性能仅受限于邻区导频的复用,这使得系统的很多性能都只与大尺度相关,与小尺度无关。大规模MIMO的无线传输技术将有可能使频谱效率和功率效率在4G 的基础上再提升一个量级。 图1. 大规模MIMO天线技术方向图

2. 非正交多址接入技术(NOMA) 5G的无线接入技术目前还有的观点关注多载波调制,如滤波器组多载波(FBMC,_ lter _bank based multicarrier),其天然的非正交性和不需要先前的分布式发射机同步。一种新的调制方式,被称为通用滤波后的多载波(UMFC)被提出。开始是OFDM信号,通过滤相邻子载波组,以减少时间/频率同步造成的旁瓣水平和载波间干扰。要解决OFDMA正交的时间窗口的缺点,即需要较大的保护带CP,使用多载波滤波器组就可以允许大的传输时延和任意高的频率补偿。日益发展的软件无线电,FFT块的大小,子载波间隔和CP长度可根据信道条件改变。因此,OFDMA允许一些参数可调,可以很好地适应5G的要求。 3. 射束分割多址技术(BDMA) 有限的频谱资源对于移动和无线技术而言是一个重大的挑战,即如何把有限的频率和时间分配给不同用户。由于这个情况,要实现提高系统的容量和质量,目前使用的多址技术包括频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)、正交频分多址(OFDMA)等。然而,现在使用的所有多址技术中,通信系统容量依赖于时间和频率。如何发展多址接入系统,提高有限频率的系统容量是一个新的挑战。 目前发明的BDMA技术,根据MS的位置分配天线波束,实现多址接入,从而显著增加系统的容量。按此观点,MS和基站在视距(LOS)的状态,因此他们明确知道彼此的位置。在此条件下,他们能够将波束直接传送到彼此的位置以通信,而不受移动台在小区边缘的干扰。 为了在5G中适应BDMA,就要发展相位阵列天线,智能天线要能够调整波束。调整波束天线通过收集从基站和MS到达角(AOA)信息设置无线配置。自适应天线阵列的使用,是提高能力的一个可能性。 4. 全频段技术 5G网络通信技术将会以智能化、宽带化和多元化为主要的发展方向。未来网络数据业务的发展方向主要在热点密集地区和室内,而当前网络数据的流量如果在少数人使用状态下不存在延迟、低网速等问题,但一旦放开使用用户数量,网络延迟和网络速度都将会是一个巨大的问题,而物联网和智能终端所依赖的移动通信网络将会处于堵塞状态,很难发挥物联网和智能终端的优势。目前5G移动通信技术所研究的超密集组网,可以针对高度使用移动数据的地区提升流量容量1000倍,很好的解决了网络数据使用密集地区的数据传输和数据容量问题。该技术的发展,虽然在数据流量方面提升率非常高,但是由于其拓扑结构也更加复杂,各网络之间的信号干扰也是一个很大的麻烦,大家都知道一旦同一个区域的无线网络过多,就会相互之间产生干扰,影响网络的传输。因此,该技术还需要进一步的研究以适用

自然人机交互

自然人机交互 普适计算以人为中心的特点迫切需要和谐、自然的人机交互方式,即,能利用人的日常 技能进行交互、具有意图感知能力,与传统的人机交互方式相比,它更强调交互方式的自然性、人机关系的和谐性、交互途径的隐含性、及感知通道的多样性。普适计算环境中,交互场所将从计算机面前扩展到人们生活的整个三维物理空间,交互方式应适合于人们的习惯并且尽可能不分散用户对工作本身的注意力。和谐自然的人机交互是实现普适计算环境,使其脱离桌面计算模式的关键所在。 2.3. 无缝的应用迁移 计算实体与用户在物理空间中的高度移动性是普适计算环境的一个重要特征。为了实现 能“随时随地”为用户提供透明的数字化服务,必须解决无缝的应用迁移这个核心问题,即随着用户的移动,伴随发生的任务计算必须一方面保证持续执行,另一方面任务计算可灵活地无干扰地移动。“移动计算”的研究以解决物理链路层面上可靠的移动互联为目标,而无缝的应用迁移则需在“移动计算”的基础上,着重从软件体系的角度解决由于计算实体与用户的高度移动带来的服务级的计算移动与软件流动。 2.4. 2.4. 上下文感知 普适计算环境最终必须有自适应、自配置、自进化的能力,所提供的服务能和谐地辅助 人的工作,最大程度地减少人对行为方式及环境的关注,而把注意力集中在人所要完成的工作本身。为此,系统首先必须知道整个物理环境、计算环境、用户状态等方面的静态和动态信息,即上下文(context)。只有具有上下文感知能力,才有可能根据具体情况采取最合适的动作自主、自动地为人们提供透明式的服务。为此,需重点研究上下文感知技术,包括上下文的采集、建模、推理及融合等。上下文感知技术是实现服务自发性和无缝移动性的关键。 2005 年国家自然科学基金委同时资助了两个以普适计算为主题的重点项目“普适计算 的关键理论与技术研究”和“普适计算研究-手语无障碍信息服务的普适计算”,分别 由上海交通大学、浙江大学、香港大学联合获得,以及北京工业大学、中山大学、中科 院计算所联合获得。 国家自然科学基金委在 2004 年与2005 年两年中还资助了四个面上项目,分别为: 浙江大学的“普适计算中的网格接入:轻量级Portal、动态协同及语义支持”(2004) 北京大学的“普适计算中基于上下文感知的个性化智能人机交互研究”(2004) 西安交通大学的“基于普适环境的上下文感知共享模型研究”(2005) 浙江大学的“面向普适环境的协同编辑中若干基础问题的研究”(2005) 5.2. 自然人机交互 随着普适计算中信息空间与物理空间的融合,人与计算环境的交互将从计算机面前扩展 至人们生活的整个三维物理空间,人之活动场所,时时处处皆有交互。在普适计算环境中,人机交互的目标是利用人们的日常技能与习惯进行交互,同时尽可能不分散用户对工作本身的注意力。终极目标是使得人与计算环境的交互变得和人与人之间的交互一样自然、一样方便。

基于手势识别的人机交互综述

基于手势识别的人机交互综述 摘要:近年来,得益于虚拟现实、人机界面技术、计算机视觉等领域的发展,基于手势识别的人机交互技术得到大力的推动。本文就基于手势识别的人机交互技术展开综述。首先概括手势交互的涉及领域,回顾其发展史和国内外研究现状。接着阐明它的基本界定和分类,并在此基础上分析其热点关键技术。然后实例讨论了几种类型手势交互的典型应用。最后给出了结论。 关键词:虚拟现实;手势交互;计算机视觉;手势识别;特征跟踪 1.引言 人机交互技术通过输入、输出设备,以有效的方式实现交互主体与交互客体的对话。当前的人机交互技术已经从过去交互主体适应交互客体,发展为交互客体不断地适应交互主体的习惯和以交互主体为中心的新阶段[1,2,3,4]。以用户为中心的,新型、自然的人机交互技术逐渐成为开发者和科研工作者的关注重点。这类交互方式要求输入与输出能够最大限度地符合交互主体的行为习惯,并能够在交互主体的脑中顺利构建交互环路。由于手势具有极强的信息表述功能,加之人手操作行为本身就是人与世界相互作用的主要方式,因此,基于手识别的人机交互技术相关研究有着重要的理论价值和应用价值。基于手势识别的人机交互技术涉及计算机科学、认知心理学、行为学等诸多方面的知识。本文不能面面俱到,仅就手势交互的基本问题:手势语义的分类,以及当前发展概况、研究热点技术和典型系统应用等相关问题进行综述。 2.研究现状 目前,基于视觉的手势交互已被广泛的研究,由于手势本身的多义性及时空差异性,加之手形变的高维度及视觉问题本身的不适定性,基于视觉的手势识别一直是一项极富挑战性的究课题[5]。需要解决的核心问题是对手形的识别,对手势的跟踪等。传统的方法主要分为两大类:(1)基于模型(model-base)的方法;(2)基于表征(appearance-based)的方法[6]。这些方法及其衍生算法极大程度地依赖于计算机科学中虚拟现实、机器视觉、模式识别、人机交互等多个领域的交流与合作。相关的国际会议:CHI、ICCV、CVPR、ICAT、IEEE VR 为研究者提供了一个能充分交流的空间,并吸引了越来越多的研究人员共同参与合作。此外,学科之间的交流也吸引了心理学研究人员的共同参与。他们以从用户为中心出发,为基于手势交互研究和开发提出了宝贵意见[7]。纵观手势交互的发展历程,其研究重点也从早期简单的系统框架、低层特征提取[8]、手形模板匹配[8]等问题转变到关节式物体跟踪[9,10, 11]、跟踪性能评价[12]、操作型手势解析[14]等问题上。我国在基于手势识别的人机交互领域的研究近年来得到了长足的发展。研究机构集中在国内的研究所和高校的科研单位。目前国内手势交互的研究成果主要有:中国科学院软件研究所[15]的研究中,对二阶自回归过程动力学模型(Auto-Regressive Process, ARP)进行训练和学习,进而建立基于ARP 的预测模型,实现了人手运动的鲁棒性跟踪,在出现跟踪丢失的情况下在后续序列中可以自动恢复正确跟踪。中国科学院自动化研究所模式识别实验室提出一种基于区域的多连接体(手指)的三维运动跟踪算法[13],用多约束融合的方法以及手指的运动特性,建立多刚体的三维运动描述,通过三类基本约束条件,把跟踪问题归结为一个约束误差优化问题。清华大学的崔锦实博士,提出一种基于回归-优化方法的关节式物体的姿态估计方法[16]。该方法把回归分析与全局优化搜索相结合,保证了估计的精度和连续性;针对现有滤波器在高维非线性多峰

毕业论文视频终端人机交互界面毕业论文

毕业论文视频终端人机交互界 面毕业论文 目录 摘要........................................................... I Abstract...................................................... II 第1章绪论. (1) 1.1课题背景 (1) 1.1.1 AVR单片机的发展背景 (1) 1.1.2 LCD液晶显示的发展背景 (3) 1.2课题的研究意义 (4) 1.3论文组织 (5) 第2章系统介绍及元器件选型 (6) 2.1系统总体介绍 (6) 2.2单片机选型 (6) 2.3液晶选型 (10) 2.4本章小结 (12) 第3章硬件电路设计 (13) 3.1整体结构设计 (13) 3.2AT MEGA16最小系统设计 (13) 3.2.1 ATmega16的复位电路 (13) 3.2.2 ATmega16的晶振电路 (15) 3.2.3 键盘译码电路的设计 (16) 3.3LCD液晶接口设计 (17) 3.4本章小结 (22) 第4章软件设计 (23) 4.1软件平台介绍 (23) 4.2软件部分整体设计 (26) 4.3矩阵键盘程序设计 (26)

4.4液晶程序设计 (27) 4.5交互窗口设计 (28) 4.5.1 如何开辟窗口 (28) 4.5.2 窗口信息控制 (29) 4.5.3 交互界面仿真结果 (29) 4.6本章小结 (31) 结论 (32) 参考文献 (33) 致谢 (34) 附录1 (35) 附录2 (40) 附录3 (45) 附录4 (49) 附录5 (71)

项目名称人机交互力反馈遥操作机器人关键技术及应用

项目名称:人机交互力反馈遥操作机器人关键技术及应用 完成人:宋爱国,宋光明,李会军,唐鸿儒,崔建伟,赵国普,徐宝国,吴涓,李建清,卢伟,包加桐 完成单位:东南大学,扬州大学 项目简介: 人机交互力反馈遥操作机器人系统将人的知识智慧与机器人的适应性相结合,通过人与机器人之间传感与控制信息的交互,可以实现各种远地环境或危险环境中的复杂作业任务,是当前各发达国家竞相发展的高技术。随着人机交互遥操作机器人在远程作业、远程监控、远程制造、远程医疗等领域的应用,迫切需要解决多个技术难题与技术瓶颈。本项目针对人机交互力反馈遥操作机器人的力感知、力反馈、大时延控制和人机交互界面设计等关键技术,经过十多年系统深入的研究,突破了多项核心技术,研制成功人机交互遥操作的关键支撑设备,填补了国内空白,并在多个重要领域得到成功应用。 本项目的技术创新点:(1)提出了一种自解耦的机器人多维力传感器的敏感单元设计方法,从传感器的结构设计上有效降低了多维力传感器的维间耦合效应;提出了一种基于误差建模的多维力传感器解耦算法,提高了多维力传感器的测量精度,测量精度可达1%F.S.。(2)提出了一种基于磁流变液控制的无源力觉再现方法,解决了大量程力反馈人机交互设备的体积大、惯性大与不安全问题,实现了大量程安全柔性的力触觉人机交互。提出了一种基于并联机构的异构式机器人力反馈手控器设计方法,解决了力反馈手控器三维平动和三维转动之间运动与力的耦合问题,六维运动位置测量精度达1%F.S.,力反馈精度达2%F.S.。(3)针对人机交互力反馈遥操作机器人在双边通讯环节上存在的短时延(≤2 秒)造成的不稳定问题,提出了力反馈遥操作机器人的多模式控制技术和自适应阻抗匹配无源控制算法,解决了短时延情况下力反馈遥操作机器人的稳定性和操作性问题;针对人机交互力反馈遥操作机器人在双边通讯环节上存在的大时延(>2 秒)造成的不稳定难题,提出了基于虚拟环境建模的力反馈遥操作机器人预测控制技术,给出了基于滑动最小二乘法的环境动力学参数在线辨识算法和模型滚动修正方法,解决了大时延情况下力反馈遥操作机器人稳定性和操作性问题。(4)提出了以提高人的感知能力为目标的交互式力反馈遥操作机器人的多感知界面设计方法,并针对人机交互界面力触觉感知与视觉感知的协调同步问题,提出了一种分布式力触觉交互的快速计算算法和无源稳定性判据,实现了多感知通道人机交互方式下具有力觉临场感的遥操作。 本项目获国家发明专利授权33项;获实用新型专利授权5项;获计算机软件著作权2项。发表论文186,其中SCI收录65篇,EI收录107篇,论文被他人引用1200多次,其中SCI他引375次,并在国际遥控机器人会议上作大会特邀报告。本项目相关成果曾获2010年国家知识产权局中国专利优秀奖、2012年与2013年日内瓦国际发明金奖等。

人机界面设计毕业论文中英翻译

良好的界面设计非常重要,因为与系统的其他特性相比,系统界面容易给用户留下更深刻的印象。毕竟,用户往往会从系统的可用性角度来审视一个系统,而不是从它如何巧妙地执行了其内部任务这个角度。从用户的视角来说,他们可能会根据系统界面在具有竟争性系统之间做出选择。因此,系统界面的设计可能成为判定一个软件工程项目是否成功的最终决定因素。 由于这些原因,人机界面在软件开发项目的需求分析阶段已经成为一个很重要的关注点,它发展为软件工程的一个子领域。事实上,有些人主张人机界面的研究是一个完全独立的领域。 对人机界面设计的研究主要来自于称为人体工程学(ergonomic)和知行学(cognetic)的工程领域,人体工程学处理协调人类体能的设计系统,;知行学处理协调人类精神能力的设计系统。这两个学科中,人体工程学更好理解一些,主要是因为人类已经跟机器打了儿个世纪的交道。这些例子有:古代工具、武器和运输系统。这些历史大部分是不证自明的,但是有时人体工程学的应用与直觉是相反的。一个经常被提到的例子就是打字机键盘(现在已经衍生为电脑键盘)的设计,其中键被有意排列,以降低打字员的速度,这样早期机器上使用的分层机械系统就不会卡住。 相反,与机器的精神交互是一个相对新的现象。因此知行学在富有成效的研究和洞察力启发方面拥有更高的潜力。通常这些研究成果更具有它们的精妙之处。比如,从表面上看人类的良好习惯有助于提高效率,但有些习惯也会导致一些错误,即使界面设计本意上是要解决问题的。考虑一下用户要求操作系统删除一个文件的过程,为了防.止误删,大部分系统都会要求用户确认一个请求,这可能会通过一个“你是否真的想删除这个文件”的信息加以确认。乍一看,!这个确认信息好像解决了误删的问题,但是使用了这个系统一段时间后,用户会养成习惯,自动回答这个要求为“是”的信息。这样,这个删除文件的任务就从包含删除命令和对问题思考后的响应的两步过程,变成了“删除一是”的一步处理过程,这就意味着当用户意识到提交了错误的删除要求时,这个请求其实已经被确认,文件也己经被删除。 当人们需要使用几个应用软件包时,习惯的形成也可能会带来问题。这些软件包的界面可能相似,但还是有些不同的。相似的用户操作可能会导致不同的系统响应,或类似的系统响应可能需要不同的用户操作。所以在这种情况下,在某种应用软件上养成的操作习惯可能会在其他应用软件上导致错误的发生。 另外一个与人机界面设计研究有关的人类特质就是人类注意力的狭隘性,也就是当集中度增加时,人类注意力往往变得更加专注。随着人类越来越专注于手头上的工作,打破这种专注也越来越困难。1972年.一架商务飞机因为飞行员太过专注于降落器的问题(实际上,是在处理改变降落齿轮指示灯的过程中),尽管当时在驾驶舱里的警报已经很响了,飞机还是笔直地撞向地面,造成空难的发生。 个人计算机的界面中经常会出现一些小状况。比如,大小写灯是为了显示键盘处在大写键锁定模式下(即“大写锁定”键被按了)。但是,如果有人不小心按了大小写按键,直到 奇异的字符出现在屏幕_匕用户才会注意到灯的变化。即使如此,用户依然会迷茫一会才会发现问题的原因。从某种意义上来说,用户看不到大小写灯的变化是很正常的,因为键盘的指示灯不在用户的视线范围之内。但是,通常用户不能注意到直接放置在他们视线中的指示灯。比如,用户会专注于他们的工作而无法发现显示器上光标的形状,即使观察光标是他们的工作之一。 还有另外一个在界面设计阶段必须预先考虑的人类特质就是并行处理多个事情时有限的思考能力。在195年《心理评论》的一篇文章中,George https://www.wendangku.net/doc/a55334784.html,ler的研究表明,人类大脑在同一时间最多处理7个细节问题。因此,界面被设计成:当决定需要时,界面_L要呈现所有相关的信息,而不是依赖于人类用户的记忆,这是非常重要的。特别地,要求人类记住先

智能机器人关键技术及其发展趋势

智能机器人的关键技术及其发展趋势 机器人是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。按联合国标准化组织采纳了美国机器人协会给机器人下的定义,即为:一种可编程和多功能的,用来搬运材料、零件、工具的操作机;或是为了执行不同的任务而具有可用电脑改变和可编程动作的专门系统。 而智能机器人有相当发达的“大脑”。在脑中起作用的是中央计算机,这种计算机跟操作它的人有直接的联系。它给人的最深刻的印象是一个独特的进行自我控制的“活物”。其实,这个自控“活物”的主要器官并没有像真正的人那样微妙而复杂。到目前为止,在世界范围内还没有一个统一的智能机器人定义。大多数专家认为智能机器人至少要具备以下三个要素:一是感觉要素,用来认识周围环境状态;二是运动要素,对外界做出反应性动作;三是思考要素,根据感觉要素所得到的信息,思考出采用什么样的动作。 智能机器人根据其智能程度的不同,又可分为三种: 传感型机器人,又称外部受控机器人。机器人的本体上没有智能单元只有执行机构和感应机构,它具有利用传感信息(包括视觉、听觉、触觉、接近觉、力觉和红外、超声及激光等)进行传感信息处理、实现控制与操作的能力。受控于外部计算机,在外部计算机上具有智能处理单元,处理由受控机器人采集的各种信息以及机器人本身的各种姿态和轨迹等信息,然后发出控制指令指挥机器人的动作。目前机器人世界杯的小型组比赛使用的机器人就属于这样的类型。 交互型机器人,机器人通过计算机系统与操作员或程序员进行人-机对话,实现对机器人的控制与操作。虽然具有了部分处理和决策功能,能够独立地实现一些诸如轨迹规划、简单的避障等功能,但是还要受到外部的控制。 自主型机器人,在设计制作之后,机器人无需人的干预,能够在各种环境下自动完成各项拟人任务。自主型机器人的本体上具有感知、处理、决策、执行等模块,可以就像一个自主的人一样独立地活动和处理问题。机器人世界杯的中型组比赛中使用的机器人就属于这一类型。全自主移动机器人的最重要的特点在于它的自主性和适应性,自主性是指它可以在一定的环境中,不依赖任何外部控制,完全自主地执行一定的任务。适应性是指它可以实时识别和测量周围的物体,根据环境的变化,调节自身的参数,调整动作策略以及处理紧急情况。交互性也是自主机器人的一个重要特点,机器人可以与人、与外部环境以及与其他机器人之间进行信息的交流。由于全自主移动机器人涉及诸如驱动器控制、传感器数据融合、图像处理、模式识别、神经网络等许多方面的研究,所以能够综合反映一个国家在制造业和人工智能等方面的水平。因此,许多国家都非常重视全自主移动机器人的研究。 下面就机器人的控制技术以及列举几种常见的机器人对当前智能机器人的关键技术进行分析。

相关文档
相关文档 最新文档