多媒体人机交互技术

上传人:gao****ang 文档编号:157311005 上传时间:2022-09-29 格式:DOCX 页数:51 大小:149.85KB
收藏 版权申诉 举报 下载
多媒体人机交互技术_第1页
第1页 / 共51页
多媒体人机交互技术_第2页
第2页 / 共51页
多媒体人机交互技术_第3页
第3页 / 共51页
资源描述:

《多媒体人机交互技术》由会员分享,可在线阅读,更多相关《多媒体人机交互技术(51页珍藏版)》请在装配图网上搜索。

1、第五章多媒体人机交互技术课前索引人机交互(Human Computer Interaction)是研究人与计算机之间的交互技术。由于 计算机的应用越来越广泛,功能越来越强,计算机能处理和表现越来越多的信息。目前, 计算机能够处理图形、图像、动画、视频、语音、音乐、文字等不同的媒体,但缺乏仿生 的眼睛和耳朵,也没有从外部世界收集信息所需的触觉、味觉和嗅觉。计算机没有语言能 力,没有四肢,没有建立各种各样信息表达形式的能力,所以,我们目前仍然以键盘和鼠 标为主要输入工具,输入输出严重不平衡,这就限制了人和计算机之间的信息沟通。不能 充分利用人的认知资源,人们长期追求的以自然的方法和计算机交流的理想

2、仍然无法实现 许多新的计算机应用技术无法普及。因此,人和计算机之间的交互显得日益重要。5.1多媒体人机交互技术概述人机交互技术是计算机应用的核心技术,以用户为中心是人机交互界面设计的核心思想,人机 界面作为人与计算机通信的途径,其效果好坏直接影响到用户使用计算机的效率以及软、硬件功能的 发挥,现有的人机交互技术已落后于计算机软、硬件的发展,成为信息产业急待解决的问题,美国将 软件、人机交互、网络和高性能的计算机并列为21世纪信息技术计划的基础研究内容,我国“ 973” 计划也将人机交互技术与虚拟现实的真实感作为科技攻关的关键问题。5.1.1人机交互技术的概念及发展历程人机交互系统是实现人与计算

3、机之间通信的软、硬件系统的总称,包括人机交互硬件 和人机交互软件两方面,前者有:键盘、鼠标、显示器、打印机等硬件设备;后者又分为系统软件(如 鼠标、打印机驱动程序等)和应用软件通常是指人机交互界面。人机交互技术(Human-Computer Interaction)就是研究人与计算机之间相互通信的技术,人机界面(HCI, Human Computer Interface) 是实现人与计算机信息交互的平台,通常是指人机交互软件界面。多媒体人机交互技术是指人们通过 各种媒体与计算机进行通信的技术,它含盖了:文字、图形、图像、动画、声音、视频等多种信息的 交互。现有的人机交互方式有:看、听、说和操作

4、,人可以通过操作键盘、鼠标、跟踪球、操纵杆、 光笔、手写板、触摸屏、数字化仪、扫描仪、话筒、摄像头等输入设备向计算机输入信息;计算机也 可以通过显示器、打印机、绘图仪、音箱、耳机、立体眼镜、头盔显示器等输出设备向人反馈供信息。随着计算机技术、多媒体技术、虚拟现实技术以及网络技术的发展,人机交互的内容 与形式日益丰富,交互的方法也层出不穷,不断向人机交互技术提出新的、更高的要求。人机交互技 术随着交互设备和软件技术的发展也在不断进步,回顾人机交互技术的发展历程,它大致经历了手工 操作、命令行界面(CLI, Command Line Interface)和图形用户界面(GUI, Graphic U

5、ser Interface) 三个阶段。1手工操作阶段自从1946年世界上第一台数字电子计算机ENIAC在美国宾西法尼亚大学诞生以来,早 期计算机程序和数据的输入是采用穿孔卡片或穿孔纸带进行的,计算机的状态用指示灯来显示,计算 结果由打印机打印输出。穿孔卡片或纸带上的程序和数据是人们用手工将二进制机器码输入穿孔机, 再交由阅读机读入计算机的,这时的人机交互是相当原始的,程序输入错了也没法修改,只能将纸带 报废,输出界面也很不直观,更谈不上实时交互。2命令行界面到了上个世纪50年代中期,出现了终端显示器,这时显示器和键盘是一体的,在内部缓冲寄存 器的支持下,构成了字符显示终端,它显然比穿孔卡片或

6、穿孔纸带使用起来方便得多,由于有输入缓 冲器,所以输入的错误可以及时修改,终端显示器的输出也比打印机的速度要快得多,而且便于连续 使用。后来随着汇编语言和一些高级语言如FORTRAN、COBOL、LISP、PASCAL和BASIC等语言的出现, 为了便于操作和控制作业,逐步发展出了交互式命令语言及其有关标准,当时的终端分为批处理终端 和交互终端,在批处理终端上一次提交的是整个作业计算机按照指令顺序执行,而在交互终端上人们 可以每次向计算机输入一行命令或数据,计算机逐条解释执行,并在显示器上输出结果。为了便于输 入数据,人们还编制了文本菜单程序,用户可以在计算机的提示下通过问答的方式输入数据,第

7、一次 实现了人机交互,这一时期的人机界面被称作命令行界面,可以看作是第一代真正的人机界面。它的 操作由熟练的操作员通过键盘输入来进行,输出的也只能是静态字符,交互的方式单一、自然性差、 效率低。3图形用户界面图形用户界面的出现使人机交互技术向前迈进了一大步,普通的用户不须要懂计算机,更不须要 记住烦琐的操作命令,所有图形用户界面下的应用程序界面标准是统一的,操作是相同的,用户只须 轻点鼠标就可以完成所有操作,非常简单、易于掌握,极大地推动了计算机的普及应用。图形用户界面起源于上个世纪60年代,1963年美国麻省理工学院(MIT)的Sutherland发明了 Sketchpad技术,并首次引入了

8、菜单、瓦片式层叠窗及图标,并采用光笔进行绘图操作,同年美国 斯坦福(Standford)研究所的Engelbart发明了鼠标器,到了 70年代美国施乐(Xerox)公司的Alto 计算机首次使用了位图显示技术,开发出了可重叠菜单、弹出式菜单和滚动条,成为了日后图形用户 界面的基本要素。1984年美国苹果(Apple)电脑公司在此基础上开发出了 Macintosh计算机,成为 世界上第一台图形用户界面计算机Macintosh风格也成了图形用户界面的标准,它以窗 (Windows)、 图标(Icon)、菜单(Menu)和指点装置(Pointing device)为基础形成了所谓WIMP界面,198

9、6 年美国微软(Microsoft)公司推出了 Windows视窗操作系统,以后版本不断更新,成为风靡全球的 图形用户界面操作系统。WIMP界面是第二代人机界面,输入采用鼠标,输出可以是二维的图形或图像,与第一代人机界 面一命令行界面 (CLI界面)相比,其交互的自然性和效率都大为改观,但它们都属于单通道人机交 互界面,不具备使用多种媒体以及三维交互的能力。现在的人机交互技术向网络化、多媒体、多通道 和智能用户界面方向发展,为新一代人机交互界面的开发提出了新的课题。5.1.2人机交互技术的主要研究内容人机交互技术与认知心理学、人机工程学、多媒体技术以及虚拟现实技术密不可分, 其中认知心理学和人

10、机工程学是人机交互技术的理论基础,而多媒体技术和虚拟现实技术为人机交互 技术提供了更丰富的表现手段和更高的要求。1. 认知心理学认知心理学(Cognitive Psychology)起源于上个世纪50年代,到70年代在西方已 成为心理学的一个主要研究方向。它研究人的认识过程,如注意、知觉、表象、记忆、思维和语言等, 从心理学的观点研究人机交互的原理。该领域通过视觉、听觉等手段接受和理解来自周围环境的信息 和感知过程,以及通过人脑进行记忆、思维、推理、学习和解决问题等人的心理活动的认识过程。认 知心理学是人机交互界面设计的依据,人的认知过程包括人的感官(视觉、听觉和触觉)是如何接受 信息的,人又

11、是如何处理信息、理解信息、记忆信息以及如何进行推理,只有了解了这些,才能进行 界面设计。一个交互的计算机系统,要能很好地实现用户与计算机之间的人机交互,通常必须考虑三个 元素:人的因素、交互设备及实现人机对话的软件。交互计算机系统的最终目标是让用户能方便自然 地和计算机进行交互式操作,因此设计交互计算机系统时,必须把满足用户的使用要求作为重要依据。2人机工程学人机工程学(Ergonomics )是指用系统工程学的方法研究人体科学与环境科学相互作用、相互影响,从而进行优化设计以提高功效的一门综合科学。经典的人机工程学称为硬件人机工程, 主要研究在系统设计时如何考虑人的体力、耐力和舒适度等人的因素

12、,以使系统设计最优、工效最高。 软件人机工程学研究软件和软件界面,侧重于运用和扩充软件工程的理论和原理,对人机界面软件进 行分析、描述、设计和评估等。主要解决有关人类思维与信息处理的有关问题,包括设计理论、标准 化、增强软件的可用性的方法等,使计算机与人的对话能满足人的思维模式与数据处理的要求,实现 软件的高度可用性。从科学和技术的角度看,人机工程学是研究“人机环境”系统中这三要素之间的 关系,为解决系统中人的效能、健康问题提供理论与方法的科学。人机工程学主要研究的内容有:人与机器之间的分工与配合;机器如何能更适合人的 操作和使用,以提高工效、减轻人的劳动强度;工作环境对操作者的影响,如何改善

13、工作环境;如何 设计人机界面、信息传递的方式以及显示方式等。3多媒体技术多媒体技术是指计算机处理多种信息如:文本、声音、图形、图像、动画和视频信息 的技术。引入多媒体技术极大地丰富了计算机对信息的表现形式,同时也增加了人机交互的途径,在 串行、字符信息和并行、联想信息方面扩展了人的信息处理能力。另一方面,多媒体技术为多通道人 机交互提供了手段,使用多通道人机交互技术,可以提高计算机对信息的识别、理解能力,增加人机 交互的效率,使交互更自然,界面更友好。4虚拟现实技术虚拟现实(Virtual Reality, VR)就是通过三维空间设备在计算机上营造一个虚拟环境,人可以通过视觉、听觉、触觉与虚拟

14、世界进行交互,使人有身临其境的感觉。虚拟现实技术的特 点是:真实感、沉浸感和交互性,自然和谐的交互方式其研究的重要内容。虚拟现实交互设备有:三 维鼠标、三维跟踪球、三维游戏杆、三维扫描仪、数据手套、数据衣、触觉和力学反馈装置、位置跟 踪器、眼动跟踪器、立体眼镜、头盔式显示器、洞穴式显示器和大屏幕立体显示器等。虚拟现实交互 设备极大地丰富了人机交互的手段,将传统的二维、静态的人机交互方式扩展到三维、实时的动态交 互,这对人机交互技术提出了更高的要求。5.1.3 人机交互界面的创意设计“创意”在人机界面方面主要是屏幕设计。除了对计算机屏幕进行空间划分外,在时间轴上 还要根据需要以音乐、解说和动画等

15、形式加以表现。时间和空间统一起来构成一个完整的屏幕设计。1. 屏幕设计创意一个屏幕含有背景、标题、描述(文字、图形和动画等)、各种控制(如跳转按钮等)等空间成 分,以及与之同步的背景音乐和解说词等时间成分。屏幕设计创意是通过各种艺术表现手法和各种技 术手段表现一个与主题相适应、为主题服务的意境。它包括表现样式、风格追求和对信息内容的合理 布局等等。当创意作用于屏幕的设计与制作时,将信息内容的本来意义与创意设计出来的各种形象、 符号、图标、字体及正文进行刻意的编排,在整个屏幕的视觉审美结构上达成有机融合,能够进一步 增强屏幕的直观感染力和耐人寻味的可视性。一个屏幕载有各种媒体信息,图文并茂,有多

16、层结构,并具有动态特性,其信息指向也是多向 的。在进行设计时,通过直观的图形、图像、文字、概念、色彩等各种造型要素及信息菜单、信息正 文所构成的总体感性印象及心理感受来传达信息内容。各构成要素就是传达特定信息的载体,将这些 构成要素按照视觉运动的法则精心地编排组合使它们在组合中有主有次、有轻有重、有大有小、有疏 有密、有曲有直,从而使这些要素和谐地出现在一个屏幕上,使其相辅相成,成为具有活力的有机体, 以发挥最有效的诉求效果,更好地传达信息。2. 屏幕创意设计原则屏幕创意设计包括文字排列方向、字群聚散组合、字体大小风格的选择、图片的分布及色彩 与空白的经营。从狭义的概念上讲,所研究的是各种视觉

17、元素的位置、面积、大小的排列组合和视觉 流程问题;从广义上讲,它更多的是研究各种视觉元素通过搭配协调所构成的格调,强调美的韵味设 计,使使用者在接受屏幕信息的过程中,能感受到设计者对美的追求及对信息内容的主题思想、立场 倾向和风格特点的把握与理解,从而强化信息主题的有效传达。进行屏幕界面的创意设计时,必须遵循以下几条构成原则:(1)内容与形式表现必须统一,形式表现必须服从内容要求。如在造型上各构成要素规格化 的设计样式要统一。(2)要充分考虑各构成要素之间的视觉流程,能自然而有序地达到信息诉求重点的位置,突 出主题。3)注意保持屏幕界面在视觉上的相对均衡感,使其在形式结构上得到正确的配置。(4

18、)注意屏幕设计中的空白处理,空白的处理对提高网页的视觉效果有极为重要的意义。 对空白的正确规划,不仅能使屏幕设计流畅明快,疏密有序,布局清晰,而且在视觉上有强烈的集中 效果,有利于突出诉求重点。(5)注重整体的对比因素,设计中各构成要素在组合时,要注意其结构形态的轻重、大小、 虚实、多少等对比因素,加强视觉力度,以强化屏幕界面的整体吸引力。(6)注意提高屏幕界面信息内容的视读性。设计中要注意主要信息内容易读的视觉效果。 对信息文字的字体形态、大小变化及字距行间的排列及字的高度宽度作出适当的处理,使其集中紧凑, 流动有序而不松散杂乱。(7)创造一定的韵律感。反映在页面设计中就是利用有力的线条、形

19、体及色彩形成一种有节 奏性的律动感,能引导人的视觉以一种流畅而有停顿的方式运动,使人能够抑扬起落地浏览整个屏幕 界面,阅读时感到轻松而又富于韵味。閣工2观觉疣向3. 屏幕创意设计表现手法屏幕创意设计表现手法是指调整所涉及的一切视觉构成元素以突出设计者所表现内容的方法。视觉构成元素包括视觉流程、点线面的关系、形状间的组合、对比与统一、节奏与韵律、装饰与趣味等等1)视觉流程视觉流程是指人们在阅读一种信息载体时,视线总有一种自然的流动习惯,通常都是从左到右, 由上到下,由左上方沿着弧形线向右下方流动的过程(如图5-2所示)。其注意值随着下移逐渐递减。在此 流动线上的任何点,都会比流动线外的任何点明显

20、。故在设计屏幕界面时应能巧妙运用视觉流程对视觉进 行导向作用,对不同性质的信息作有序处理,从而引导人们的视线按照设计意图更有效地接受信息。2)点线面的关系屏幕界面的三大要素文字、图形、色彩的抽象就是点、线、面。它们彼此交织,互相烘托。一个图标、一个小三角、一个小饰花都可以抽象成一个点。由于点在画面的空间中具有一种张 力作用,当空间中有两个同等大的点时,其张力作用就表现在连接这两点的视线上,在心理上产生吸 引和连接的效果。当画面中的两点大小不同时,人的注意力首先会集中在较大的一方,而向较小的一 方转移。点的形态、大小、位置的不同,都会产生不同的视觉联想和感受。它可以在视觉上产生心理 张力,引导视

21、觉流向,而且起着活跃、平衡、稳定、丰富画面的作用。线具有较强的感情性格,如直线给人的感觉是稳定而静止,而曲线给人的感觉是具有速度、动力或弹力。线的粗细不同,曲直形态不同,方向不同,都会产生不同的视觉感受和联想。面的形状丰富多变。规则轮廓线的面较严肃,无规则轮廓线的面较活泼。圆弧形或曲线形柔和 而圆满,富于人情味。而正三角形蕴含着稳定和永恒。(3)形状间的组合 屏幕界面是以文字、图形、色彩的组合来传达信息的。文字、图形、色彩在设计中以点、线、 面的形式,在平面上构成了各种各样的形状,称其为“形”。形与形之间具有多种组合,如分离、接 触、覆叠、联合等等。这些形的组合使屏幕界面更加丰富、富于变化、且

22、具有层次感。(4)对比与统一 对比是屏幕界面取得强烈效果的最重要的手段。彩度上的艳与灰、亮度上的黑与白、浓与淡、 面积上的大与小、运动上的动与静、数量上的多与少、质量上的疏与密等都是对比。在视觉设计中, 对比强烈的注视率就高。统一是高层次上的协调,协调是对比的对立。协调和对比的屏幕界面多了, 都会使人疲劳。任何视觉设计既要有对比上的差异性,又要有调和上的共同性。只有使对比与协调相 统一,才能使屏幕界面既生动活泼,又流畅自然。(5)节奏与韵律 节奏和韵律运用在屏幕界面设计上,是指各种造型构成要素的点、线、面所形成的一种自然秩 序,规律节奏的美。其表现手法有反复、连缀、转换、渐变、特异等。在自然界

23、中美的形式规律有两种:一是秩序美,二是特异美。秩序性是形式美规律的重要因 素。如同构的排列、形象的重复、方向的一致、或色彩的统一等均具有构成的同一性,这些方面都发 挥着协调统一的作用。特异是对规律的突破。在屏幕界面设计中,如果出现局部或小部分与整体编排 秩序不符,往往更能引起用户的关注,突出了设计的内容。一种特异的形象往往会吸引视觉流向,成 为视觉注意的中心。(6)装饰与趣味 屏幕界面的装饰是指造型和色彩点缀、各类外框线、跳跃的点等等。屏幕界面的装饰是一种美 化。美化了的屏幕界面能够提高传达信息的效率。趣味是一种活泼性的视觉语言。增加屏幕界面的趣 味性能使信息添翼,使界面更新奇且耐人寻味。5.

24、2?图形用户界面随着计算机技术的发展,特别是鼠标器的发明、图标的使用以及可重叠菜单、弹出式菜单和滚动 条的开发成功,到了 20世纪80年代诞生了图形用户界面(GUI),即所谓WIMP界面以窗口 (Windows)、 图标(Icon)、菜单(Menu)和指点装置(Pointing device),为基础的交互界面,首先是美国苹 果(Apple)电脑公司开发出了世界上第一台图形用户界面计算机一Macintosh计算机,Macintosh 风格也成了图形用户界面的标准,接着美国微软(Microsoft)公司推出了 Windows视窗操作系统, 并迅速成为风靡全球的图形用户界面操作系统,到了20世纪9

25、0年代基于图形用户界面的软件已经超 过了字符界面下的软件,图形用户界面已经成为计算机人机交互技术的主导方式,图形用户界面极大 地方便了广大非计算机专业人士使用计算机,其操作非常简单、易于掌握,极大地推动了计算机的普 及应用。5.2.1图形用户界面的特点1. 桌面隐喻(desktop metaphor)桌面隐喻是指用图例表示计算机可以进行的操作。图形用户界面中的图例具有一定的含义,可以 表示对象、动作或属性等。图例可以是静态图标也可以是动画或视频。隐喻的方法有三种,一种是直 接隐喻,即隐喻的本身为操作对象,如画笔绘图工具中的直线和圆图标,分别代表画直线和画圆操作; 第二种为工具隐喻,如用打印机图

26、标表示打印操作,这种隐喻使用最多;第三种为过程隐喻,通过描 述过程来暗示该操作,如Word中的撤消和恢复图标。在图形用户界面中,大量使用隐喻,隐喻与用文字表达相比,具有直观、形象生动的优点,但是 隐喻需要占用一定的屏幕空间,并且很难表示一些抽象的概念。2. 所见即所得(What You See Is What You Get, WYSIWYG)所见即所得技术表示界面中显示的格式即为最终输出的结果。目前大多数编辑软件都具有所见 即所得界面,例如,预览时所见到的与最终输出的一致。所见即所得技术是将编辑界面中的格式控制 符直接显示输出。但有时屏幕上的配色方案与打印机的配色方案不尽相同,使得打印输出有

27、所差别。3. 直接操纵(Direct Manipulation)直接操纵是指把操作的对象、属性和关系显式地表示出来,用鼠标、光笔、触摸屏或数据手套 等指点设备直接从屏幕上获取形象化命令与数据的过程。直接操纵具有以下特性:(1)用物理动作或图标代替了复杂的操作,这种图标与其实际内容应该是相近的,用户能通过 屏幕上的图标想象或感知其内容。例如,用文件夹表示磁盘目录,用户可以双击打开它,也可以将它 拖到废纸篓中而删除它。(2)用指点和选择操作代替键盘输入。其优点是操作简便、快捷,不用记忆烦琐的命令,尤其 适用于非专业用户。(3)操作结果立竿见影,交互性强。用户可以立即看到操作结果,便于及时修改和更正

28、。(4)支持逆向操作。用户在使用过程中,不可避免地会出现一些操作错误,有了直接操纵后, 操作错误更加明显,因此系统必须提供逆向操作功能,即能方便地恢复到错误操作以前的状态。目前 大多数直接操纵编辑软件都提供撤消和重做(Undo & Redo)功能,便于更正错误操作。5.2.2 图形用户界面的设计1.设计原则(1)一致性原则,在同一用户界面中,所有的菜单、对话框及术语应保持同一风格。(2)提供快捷操作方式,对于常用操作要提供快捷操作方式,例如存盘、打开等操作设置快捷 方式可以提高工作效率。(3)提供错误检测及错误处理机制,当出现操作错误时,系统应能检测出来,并保持操作前的 状态,提醒用户改正错误

29、。(4)提供信息反馈功能,对于重要的操作,系统应有提示信息,待用户确认后方可进行,这样 可避免发生重大操作错误。例如,关闭还未保存的文件时,系统要提示是否要保存该文件。(5)提供逆向操作功能,允许用户撤消错误的操作,有的软件可以退回好几步,对错误的操作 采取比较宽容的态度,有利于用户进行各种尝试,把全部精力都用到创作中去,而不必为不满意的尝 试而后悔不已。(6)提供联机帮助功能,即使是熟练的用户也不可能记住复杂软件的所有功能的使用,系统应 该能够提供上下文关联的帮助系统,使用户可以及时获得帮助,便于掌握软件的使用。(7)对于图形用户界面的用户来说,屏幕的合理使用有为重要,要提供多窗口管理,如平

30、铺、 层叠窗口,对于每一个窗口要提供缩放功能。2色彩的运用色彩是屏幕设计的一个重要方面,运用的好能吸引用户的注意力、突出重点给用户以美的享受;运用不好则使用户眼花缭乱、分不清主次甚至看不清显示的内容。使用色彩应注意以下几点:(1)在一幅画面中使用的色彩种类不宜太多,最好不要超过5种,太多使人眼花缭乱,可用不 同层次和形状来配合颜色,以增加变化。(2)画面中重要的或活动的对象采用鲜艳的颜色,而不重要的或非活动的对象使用较暗淡的颜色。前景使用鲜艳的颜色,背静采用暗淡颜色。(3)当需要区分不同对象时,首先按亮度大小,然后在按颜色不同来区分。(4)在一个系统中,各种颜色的意义应该符合人们的习惯并保持一

31、致,例如,红色表示错误,黄色表示警告。(5)避免使用不兼容的颜色配伍,如蓝/黄、红/绿、红/蓝、绿/蓝,这些色彩对比强烈的颜色组合,会在边界上产生颤抖或余像效应,影响观看。好的色彩搭配见下表:表 色彩搭配组12345678前景色白x717黑红绿蓝青品红黄背景色蓝rm白黄x717黑白蓝rmT717黑红x717黑黄白蓝rm黄x717黑白蓝rm红绿x717黑红青红蓝rmx717黑3.色彩的设计方式 色彩和图像、文字一样是界面的一个元素,在界面设计中起着特殊的作用。色彩可以吸引人的注意力,影响人们的情绪,向人们传达特定的信息含义。色彩的适当配合可以给人以美感,使人振 奋、愉快。在人机交互中,使用颜色有

32、以下优点:(1)温和夺目,把用户注意力吸引到重要信息上。例如,制作一个色彩鲜明的标题将有助于和其他屏幕显示信息相区别,减少了搜索重要信息的时间。(2)突出信息的逻辑结构,便于对信息进行分类。例如,对同类信息可以使用同种颜色显示, 帮助用户对相关信息进行分类和提取。(3)给缺少趣味的显示增添特色,改善人的视觉印象,使人愉快、兴奋、增强兴趣、减少疲 劳。一个设计良好的具有彩色显示的人机界面软件系统,将更容易打动用户,取悦用户,极大地增强 产品的商业竞争力。在输出显示中,屏幕页面色彩配置是否协调对整个观感很重要。应根据内容的需要,对页面中 各对象的色彩基调、色彩布局和背景颜色作合理的安排。力求使页面

33、色彩与所要表达的主题、内容、 形式、风格相一致;基调要统一,对比要和谐;底色应明快,装饰应新鲜、稳重。在人机交互中色彩的使用主要遵循以下原则:(1)正确选择色彩基调版面色彩基调应选择与作品内容、结构、风格、样式相吻合的色彩。不同的色彩有不同的感 染力和表现力,给人以不同的感受。这种配合内容的色彩称为优势色彩。优势色彩是贯穿作品始终的 基础色彩。(2)文字色彩与画面色彩应协调、柔和 通常用中性色彩或画面色彩的补色作为字幕的颜色,中性色彩包括黑、白、灰、金、银色等, 这些色彩与大部分版面色彩相配都能达到比较好的效果。不宜使用红 /绿、红/蓝、绿/蓝、蓝/黄这 些组合颜色对,因为它们会使相邻边界产生

34、振荡和余像。一般地,黑色在黄色背景上反衬清晰度最高, 而黑色在蓝色背景上、蓝色在红色背景上反衬清晰度最低。字体清晰度与背景色的匹配如表 5-1 所示。表 5-1 字体清晰度与背景色的匹配字块色彩背景色彩显示效果字块色彩背景色彩显示效果黑字黄色好蓝字黄色较好绿字白色好黄字白色较差蓝字白色好红字绿色较差黑字白色好蓝字红色较差白字黑色较好蓝字黑色较差白字紫色较好紫字黑色较差白字蓝色较好紫字红色较差白字绿色较好绿字灰色较差绿字黑色较好绿字红色较差(3)尽量使用不易产生视觉疲劳的色彩心理学和生理学的知识告诉我们,色彩会对人产生视觉感受并引起疲劳等方面的心理影响。一 般说来,对带绿色成分的黄绿、蓝绿、淡青

35、色,人的眼睛感觉舒服,不易引起疲劳;红色、橙色居中 而蓝色、紫色最易引起视觉疲劳。(4)选择合适的颜色种数 每次显示使用颜色不宜过多,使用过多颜色的屏幕反而不利于区分颜色及颜色的含义。在非必要情况下,显示使用的颜色宁少勿多(4个以下),至多不应超过5一7个。(5)处理好对比与和谐的关系对比是以合理的色彩布局为前提,以视觉平衡为准绳,在对比中求和谐,在和谐中体现力度, 使版面色彩具有美的视觉感受。如在色的对比方面,常用类似色进行对比,以获得悦目、柔和的艺术 效果。在色的饱和度对比方面,颜色反差的强弱与色调的相对纯度有较大关系,复色比单色具有更柔 和的反差效果。色的面积对比是突出色的质感和力度的重

36、要手段,应仔细考虑背景画面的色块分布与 字幕色块之间的关系,应避免使互为补色面积相近的大色块相互靠近,且色块最好不要孤立出现,尽 量使用其他颜色相衬托。色的动静对比是指色彩的运用与物体运动轨迹所造成的色彩流动有关,当一 个运动画面与一静止画面衔接时,画面的字幕应具有动感,以保持其运动的连续性。(6)使用一致性的颜色显示一致性是人机界面领域的普遍原则,在显示颜色上的设计中还应注意全过程字幕色彩基调相对 稳定。画面段落内的色彩基调不要随意反复变化,必须服务于全面的主题、情节和客观环境,要保持 层次之间色彩基调的连续性。4. 屏幕的布局(Layout)屏幕布局应该使各功能区明显、突出重点,一般应遵循

37、以下几个原则:(1)平衡原则,屏幕的上下左右布局要平衡,不要虎头蛇尾或一边重、一边轻(2)顺序原则,对象显示的顺序应按需要排列,重要的先出现的对象先显示。(3)经济性原则,在有限的屏幕空间中既要提供足够信息量,又要注意信息的简明、清晰。(4)规范化原则,在一个系统中,对话框、提示行等要统一规范(5)可预期原则,对象的操作结果要可以预期。5. 菜单界面的设计菜单在图形用户界面中广泛使用,菜单界面设计的关键是确定菜单选项和菜单结构。菜单选项 有:命令项、菜单项和窗项。命令项用来执行一条命令,如File (文件)菜单下的Exit (退出) 命令;菜单项是用菜单显示的一组相关的命令;窗口项是以弹出式窗

38、口的形式显示的一组操作。菜单 结构有:单一菜单、线状序列菜单、树状菜单和网状菜单等,其中树状菜单最为常见。单一菜单是菜 单中只有一组选项,可进行单选或复选。线状序列菜单是把一组相关的菜单组合在一个菜单中,例如 Word 中字体菜单,可以定义字体、字型、字号、颜色和效果等。树状菜单是把选项划分为若干类,每 一类选项又成为一个子菜单,如此下去,形成树状结构,一般级数不宜过多,以不超过3 级为宜。网 状菜单为多级菜单结构,包括父菜单、子菜单等等,允许在父菜单与子菜单之间切换,而不必中转, 其结构比较混乱,容易迷失方向,较少使用,只在网页浏览用到。在设计菜单界面时,一般遵循如下 原则:(1) 合理地组

39、织菜单界面的结构与层次。广而浅的树状菜单比较有效,如果有下级菜单,用箭 头提示出来。(2) 按照系统的功能对菜单进行分组和排序,将同一类功能的菜单选项放在同一组中,将常用 的菜单选项放在比较靠前的位置。(3) 菜单选项的标题力求简单、明确、以关键词开头。(4) 常用的菜单选项要设置快捷键,并有文字提示。(5) 充分利用菜单选项的使能与禁止、可见与隐藏的属性,当某个选项的功能不能执行时,应 该禁止选中,不常用的菜单选项应该自动隐藏起来。(6) 合理地使用弹出式菜单,这样实现系统的功能更加简捷、高效,弹出式菜单一般不包含子 菜单。6填表输入界面的设计在需要输入大量的数据时,采用填表输入界面是最理想

40、的选择,设计填表输入界面要考虑两方 面的问题:一是表格设计;二是表格的屏幕编辑功能。设计填表输入界面时遵循的原则:(1) 表格要有标题,布局要直观,栏目按逻辑功能分组排序,栏目标题要易于理解。(2) 表格的显示要美观、清晰,避免过于拥挤。(3) 把相关的输入字段安排在一起,按照使用频率、重要性、功能关系或使用顺序进行排序和 分组。4)要有出错提示,系统应该能提示输入数据的范围和方法,对不可接受的输入给出出错提示。(5) 提供帮助,系统应该能提供帮助信息。(6) 表格的文字要易于理解,力求简明。(7) 光标的移动要方便,例如,对于固定长度的字段,输入完后自动跳到下一项,用Tab键也可以将光标移动

41、到下一字段5. 3多通道交互技术人机交互界面的发展经历了从第一代命令行界面到第二代图形用户界面,现在正在向着第三代 多通道用户界面发展,所谓多通道用户界面就是通过多个通道例如语音、手势、身体语言与计算机系 统进行通信的用户界面。多通道用户界面主要关注用户向计算机输入信息以及计算机对用户意图理解 的问题,它基于视线跟踪、语音识别、手势输入、感觉反馈等新技术,使用多个交互通道以并行、非 精确方式与计算机系统进行交互,旨在提高人机交互的自然性和高效性。多通道用户界面的研究始于上个世纪80年代,美国麻省理工大学(MIT)媒体实验室的“多媒 体自然对话”项目中的星云系统为在线信息查询提供了语音界面;卡内

42、基-梅隆大学(CMU)交互系统 实验室(ISL, Interact System Laboratory)的J ANUS项目在语音识别、语音翻译及自然语言的交 互方面做出了成绩;其INTERACT项目在手势识别、表情识别、手写输入以及多通道信息的整合进行 了探索;美国海军研究所(NRL, Navy Research Laboratory)的Intelligent M4研究组致力于研究 自然语言界面与其他人机交互方式的结合;欧洲信息技术研究战略规划(ESPRIT II)的Amodeus项 目主要研究用户和系统要求的统一表示及通道分类学;其MIAMI项目致力于多媒体和多通道人机界面 的研究,主要内容

43、是通过视觉、听觉和触觉/手势系统来访问、表示和产生多媒体信息及多通道交互 技术。英国的研究人员提出了“耳标”的概念,用声音替代了图标。国内有北京大学计算机系、中科 院软件所共同承担的国家自然科学基金项目“多通道用户界面的研究”主要探索以视线跟踪为核心的 多通道人机交互技术,内容包括多通道用户界面的输入技术、多通道信息的整合方法、多通道用户界 面的用户模型和描述方法、多通道用户界面的设计原则和评价体系以及开发环境等。5.3.1眼动跟踪人类80%的外界信息是通过视觉获得的,目前人机界面所用的交互技术几乎都离不开视觉的参 与。例如 ,当用户使用鼠标去控制屏幕上的光标来选择所感兴趣的目标时,视线随注意

44、点聚焦到该 目标上,然后检测光标与该目标的空间距离,再反馈到大脑并指挥手去移动鼠标,直至视觉判断光标 已位于目标之上为止,交互过程自始至终都离不开视觉。通过对视觉跟踪的研究,可以得知人在观测外界景物和屏幕信息时的扫描选择和注视过程,从 而研究人的视觉感知和综合的机理。在观察多目标、多任务人眼对不同位置、大小、颜色和速度的目 标的眼动敏感度、延迟、反应速度等特征进行深入的了解。视线跟踪技术有强迫式与非强迫式、穿戴 式与非穿戴式、接触式与非接触式之分,其研究内容主要有人眼的运动和跟踪技术两个方面,下面分 别介绍。1人眼的运动眼动在视觉信息的加工过程中起着重要的作用。眼动有三种形式:跳动(Sacca

45、de)、注释 (Fixation )和平滑尾随跟踪(Smooth Pursuit)。在正常的视觉观察过程中,眼动表现为在被观察目标上一系列的停留以及在这些停留点之间的 飞速跳跃。视线停留时间至少持续100ms以上的称为注视,绝大部分信息是在注视时获得并进行加工 的,在注视时,眼睛也存在快速、微小的运动,称为生理震颤,但其范围不超过1视角。视线在注视点之间的飞速跳跃称为眼跳动,它是双眼联合进行的眼动,其视角在1一40之间, 持续时间30120ms以上,最高运动速度为400一600 /s,在眼跳动期间几乎不获得任何信息,主 要原因有两个:一是由于图像在视网膜上移动过快;二是由于眼跳动时视觉阀值升高

46、。眼睛能平滑地跟踪运动速度l30/s的目标,这种缓慢、联合跟踪的眼动称为平滑尾随跟 踪。平滑尾随跟踪必须有一个缓慢移动的目标,在没有目标的情况下,一般不能执行这种眼动。在人 机交互中,眼动跟踪主要利用眼跳动和注视这两种形式。2视线跟踪技术视线跟踪的基本工作原理是利用图像处理技术,使用能锁定眼睛的特殊摄象机,通过分析人眼的虹膜和瞳孔中反射的红外线图像的连续变化记录视线的变化,从而实现视线跟踪。视线跟踪的基本要求有:要保证一定的精度,满足用户要求;反应速度要快;对用户基本无干 扰;定位校正简单;可作为计算机的标准外设。从视线跟踪装置得到的原始数据需要经过进一步处理才能用于人机交互。数据处理的目的是

47、滤 除噪声、识别定位及局部校准与补偿,最重要的是提取出用于人机交互所必需的眼睛定位坐标。但由 于眼睛存在固有的抖动及眨动或是头部剧烈运动,这些都会造成数据的中断,即使是在定位的数据段 内也存在许多干扰信号,使得提取有效的眼动数据非常困难,解决的办法之一是利用眼动的某种先验 模型加以弥补。将视线应用于人机交互必须克服的另一个固有的困难是避免所谓的“米达斯接触(Midas Touch)”问题。如果鼠标光标总是随着用户的视线移动,可能会引起用户的厌烦,因为用户可能希望能随便看 着什么而不必“意味着”什么,更不希望每次转移视线都可能启动一条计算机命令。因此,基于视线 跟踪技术建立有效的用户界面的挑战之

48、一就是避免“米达斯接触”问题。在理想情况下,界面应当在 用户希望发出控制时,及时地处理其视输入,而在相反的情况下则忽略其视线的移动。然而,这两种 情况一般不好区分。可行的解决方法是结合实际采取特殊的措施制定出相应的交互技术,例如,采用 其他通道(如键盘或语音)进行配合就是相当有效的方法。5.3.2 手势识别以手势体现人的意图是一种非常自然的方式,人类经过数千年的发展已形成了大量的、通用的 手势。一个简单的手势可以蕴涵丰富的信息,人与人可以通过手势传递大量的信息,从而实现高效率 的通信。将手势运用于计算机能够提高人机交互的效率。1 手势的分类手势可以有不同的分类:交互性手势和操作性手势,前者表示

49、特定的信息(如乐队指挥),靠 视觉来感知,后者不表达任何信息(如弹琴);自主性手势和非自主性手势,自主性手势与语音配合 用来加强或补充某些信息(如演讲),非自主性手势是一些下意识的动作,不表达任何信息(如瘙痒); 离心手势和向心手势,前者直接针对交谈者,有明确的交流意图,后者只是反映说话人的情绪和内心 的愿望。手势的各种组合相当复杂,因此,在手势识别系统中通常对手势做适当的分割、假设和约束。 例如,可以做如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要;如果手势是手 指的运动,那么手就应当处于静止状态。手势具有如下特点:(1)手是弹性物体,因此同一手势有很大差别。(2)手势含有大

50、量冗余信息。(3)在三维空间中手很难定位。(4)手势易产生阴影。2 手势的识别计算机手势识别的好坏是将手势应用于人机交互的重要前提,目前手势识别设备有:(1)鼠标和光笔。只有当用鼠标或光笔的运动变化来传递信息时,才可将它们视为手势表达工 具。这类工具的优点是易于实现,适用于一般的桌面系统,缺点是只能识别手的整体运动而不能识别 手指的运动,手势表达的动作极其有限。(2)数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,可以反映手指的动作,戴上 数据手套可以抓物体,就象用手直接操纵一样,如果手套有力反馈,还能感受到物体的重量和材质, 却点是价格昂贵,有时给用户带来不便(如出汗)。(3)计算机视

51、觉。利用摄像机记录手势,这是一种很有前途的技术,优点是不干扰用户,但目 前在技术上还存在许多困难,难以胜任手势的识别和理解。目前使用较多的是数据手套,因为数据手套可以输入三维空间的手势信息,而且比基于计算机 视觉的手势识别在技术上更易于实现。手势识别的方法有:(1)模板匹配法:将输入的手势与预存的模板进行比对,通过测量两者之间的相似度来完成四 别任务。(2)神经网络技术:这是一种较新的模式识别技术,具有字组织和字学习能力,能有效抗噪声 和处理不完整的模式,并具有模式推广能力,但系统需要较长时间的学习。(3)统计分析技术:这是一种基于概率的方法,通过统计样本特征向量来确定分类函数。在模 式识别中

52、一般采用贝叶斯极大似然理论确定分类函数,其缺点是要从原始数据中提取特征向量,而不 能直接对原始数据进行识别。5.3.3 三维交互三维空间交互技术包括三维显示技术和三维操纵技术。前者是利用人两眼的视差,在三维显示 设备(如立体眼镜或头盔式显示器)上呈现立体图像的技术。后者是利用三维交互设备(如三维鼠标、 数据手套、跟踪球、三维操纵杆)在三维空间中与计算机进行交互。三维空间控制设备至少能控制六 个自由度,分别描述三维对象的宽度、深度、高度、俯仰角、转动角和偏转角。通过控制这六个参数, 用户可以在屏幕上或沿三个坐标轴转动三维对象,目前,实现三维交互的方法有:(1)直接操纵,利用三维空间控制设备直接操

53、纵三维对象。由于在三维空间中进行,所以三维 光标必须有深度感,即近大远小,另外,三维物体必须有空间感,即光标不能进入三维物体内部,直 接在三维空间中操作,存在着了一系列的问题,需要进行大量的计算,编制接口程序具有相当的难度, 对硬件的要求也较高。(2)三维楔子(Widgets),这是三维界面中的一些小工具,用户可以使用它们在二维空间中控 制三维空间中的物体,例如,三维空间中的漂浮菜单、用于拾取三维物体的手、平移和旋转指示器等, 目前,三维楔子仍处于探索阶段,还缺乏统一的标准。三视图输入技术是利用二维输入设备在多个视图上实现三维输入的技术,例如,要输入一个点, 只要在二维空间的两个视图上输入相应

54、的坐标即可;将直线的两个端点分别在三视图上输入,便可确 定三维空间中的一条直线;将一个面的各个顶点在三视图上输入,便惟一确定了三维空间中的一个面; 如果把一个多面体的各个面均按上述方法输入,就确定了三维空间中的一个多面体。目前,三视图输 入技术在三维交互中广泛使用。5.3.4 表情识别人的面部表情相当丰富,包含着大量的信息,一个人的情绪、愿望、气质等都可以通过面部表 情表现出来,了解一个人最直接的方法是观察其面部表情,面部表情是人体语言的一部分,人的面部 表情又不是孤立的、静止的,它与一个人的情绪及所处的状态紧密相连,人的各种情绪变化以及对冷 热的感觉都是非常复杂的高级神经活动,因此如何感知、

55、记录和识别这些变化过程是表情识别的关键, 从心理学角度来讲,情绪心理至少由情绪体验、情绪表现和情绪生理这三个因素组成,而情绪表现又 是由面部表情、声调表情或身体姿态三方面来体现的。面部表情的理解主要有五个方面的问题:人脸 的分类、人脸的表征、人脸的检测、人脸的跟踪与识别、面部表情的分析与识别。迄今为止,国际上 关于表情识别的研究可以分为基于心理学的识别和机遇计算机的识别,用计算机来分析和识别面部表 情的关键是建立表情模型和情绪分类,并把他们同人脸的面部特征与表情的变化联系起来,计算机面 部表情识别通常分为三个步骤,即表情的跟踪、表情的编码和表情的识别。1面部表情的分类面部表情的分类有两种不同的

56、体系,一类是对情绪的维度分析,即把情绪用三维坐标表示;另 类是对情绪的分类,以下采用后者。汤姆金列出了8种情绪:兴趣、快乐、惊奇、痛苦、恐惧、 愤怒、羞怯、轻蔑;伊扎德在此基础上又增加了厌恶和内疚两种情绪;艾克曼定义了6 种最基本的表 情:惊奇、恐惧、厌恶、愤怒、高兴、悲伤,以及 33种不同的表情倾向。但是表情的变化又是相当 复杂的,经常混合出现,例如,恐惧和惊奇经常起出现,呈现为惊恐。下表列出了各种单表情的 结构特点表:表情的结构特点表情额头、眉毛眼睛脸的下半部惊奇 眉毛抬起,变高变弯 眉毛下的皮肤被拉伸 皱纹可能跨越额头 眼睛睁大,上眼皮抬高,下眼皮下落 眼皮可能在瞳孔的上边或下边露出来下

57、颌下落,嘴张开,唇和齿分开,但嘴部不紧张,也不拉伸恐惧 眉毛抬起并皱在一起 额头的皱纹只集中在中部,而不横跨整个额头上眼睑抬起,下眼皮拉紧嘴张,嘴唇轻微紧张,向后拉或拉长厌恶眉毛压低,并压低上眼睑在下眼皮下部出现横纹,脸颊推动其向上,但不紧张 上唇抬起 下唇与上唇紧闭,推动上唇向上, 嘴角下拉,唇轻微凸起 鼻子皱起 脸颊抬起愤怒 眉毛皱在一起,压低 在眉宇间出现竖直皱纹 下眼皮拉紧抬起或否 上眼皮拉紧,眉毛压低 眼睛瞪大,可能鼓起 唇有两种基本位置:紧闭,唇角拉直或向下;张开,仿佛要喊 鼻孔可能张大吉/ 高八眉毛稍微下弯 下眼睑下边可能有皱纹,可能鼓起,但并不紧张 鱼尾纹从外眼角向外扩张 唇角

58、向后拉并抬高 嘴可能张大,牙齿可能露出 一道皱纹从鼻子一直延伸到嘴角外部 眼睑抬起悲伤眉毛内角皱在一起,抬高,眼内角的上眼皮抬高嘴角下拉带动眉毛下的皮肤嘴角可能颤抖2. 面部表情的跟踪为了识别表情,首先要将表情信息从外界摄取回来。正如人在交流的过程中通过视觉获取对方 的表情信息一样,计算机也要以某种方式获取这一信息。3面部表情的编码要使计算机能识别表情,就要将表情信息以计算机所能理解的形式表示出来,即对面部表情进行编码。基于根据面部运动确定表情的思想,Ekman和Friesen于1978年提出了一个描述所有视觉上 可区分的面部运动系统,叫做面部动作编码系统(FACS),它是基于对所有引起面部动

59、作的脸的“动 作单元”的枚举编制而成的。在FACS中,一共有46个描述面部表情变化的动作单元(AU)和12个 描述头的朝向和视线的变化的AU。FACS系统由专人根据面部解剖活动(即肌肉如何单独或者配合着 改变面部的样子)对面部活动进行分类并完成编码。FACS编码员“解剖”表情,把它分解成特定的 些产生该运动的AU。但FACS有两个主要弱点:运动单元是纯粹的局部化的空间模板;没有时 间描述信息,只是一个启发式信息。其中 FACS 不包含情绪信息,数据的分析只是单纯的描绘运动单 元AU,或者把FACS通过字典规则转化成情绪。4面部表情的识别面部表情的识别可以通过对FACS中的那种预定义的面部运动的

60、分类来进行,而不是独立地确定 每一个点,这就是Mase,以及Yacoob与Davis的识别系统所采取的方法。例如,Yacoob与Davis根 据Mase的工作,检测脸上6个预定义的和手工预置的矩形区域中的运动(量化为8个方向),然后 利用6种表情的简化FACS规则进行识别。在他们的105个表情的数据库上,他们的总识别正确率为80%。Mase在一个更小的数据集上也 得到了 80%的正确率。考虑到FACS模型的复杂性,以及在脸上很小区域中度量面部运动的困难,这 些已经是很好的结果了。5.3.5语音识别随着计算机技术的发展,人们迫切需要一种更加自然的、更加能为多数人所接受的方式与计算 机沟通。在人机

61、对话方面寻求最好的语音信息交换手段是发展人机语音通信和新一代智能计算机的主 要组成部分。随着计算机的普及,越来越多的人在使用计算机,如何给不熟悉计算机的人提供一个友 好的人机交互手段,逐渐引起了人们的重视。从而也就诞生了计算机语音学。计算机语音学覆盖了广 泛的研究活动,包括语音识别、语音合成、语音编码、自然语言理解、机器翻译等。1语音识别语音识别技术是计算机通过识别和理解的过程把语音信号转变为相应的文本文件或命令的技 术。当人们想对计算机说话时,通常首先需要进行语音识别,即将声音信号转换成单词流。最近10 年里,语音识别技术的显著进展,带来了高性能的算法和系统。用于语音拨号、语音命令控制、简单

62、 的数据输入和准备结构化文档的语音识别工具已经开始出现。一个完整的语音识别系统应包括以下三 个部分:(1)语音特征提取语音信号在完成模/数转换后,还要进行特征提取,一方面为了获得语音的本质特征;另一方面 还可以进行数据的压缩。目前通用特征提取的方法是基于语音帧的,即将语音信号分为有重叠的若干 帧,对每一帧提取语音特征。(2)声学模型 声学模型是用于从语音到音节的概率计算。在识别时将提取的语音特征与声学模型比较并匹配,以获得最佳的识别效果。目前广泛采用的声学建模法有:隐马尔科夫模型HMM建模和上下文相关建模。(3)语言模型 语言模型用于计算从音节到字的概率。目前,语言模型主要有:规则模型和统计模

63、型两种。2.语音识别系统的工作原理语音识别的过程分为三个步骤:预处理、识别和后处理。(1)预处理包含波形硬件采样率的确定、分帧的大小和帧移策略的确定;剔除噪声的带通滤波、高频预 加重处理、各种变换策略;波形的自动切分。首先对模拟语音信号采样,将其数字化。连续语音流切分是找出语音信号中的各种识别基元 (如音素、音节、半音节、声韵母、单词或意群等)的始点和终点的位置,进而将对连续语音的处理变 为对各个语音单元的处理。语音端点检测指的也是连续语音流切分。(2) 识别包含特征参数提取;参数模板存储及识别。识别语音的过程,实际上是对语音特征参数模式的比较和匹配的过程。寻找一个既能充分表 达语音特征又能彼此区别的、较稳定的特征参数是很重要的。语音识别系统常用的特征参数有线性预 测系数、倒频谱系数、平均过零率、平均能量、短时频谱、共振蜂频率及带宽等。识别参数的选择着 眼于能得到高的识别率,由于有些参数的提取较为复杂,计算较费时,因而要折衷考虑选用哪些参数 并确定采用哪种识别方法。提取特征参数后,应对系统进行训练和聚类。通过训练,系统建立并存储一个该系统需识别 字(或音节)的参数模板库。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!