人机交互解读

上传人:h****M 文档编号:68298824 上传时间:2022-04-02 格式:DOC 页数:27 大小:186KB
收藏 版权申诉 举报 下载
人机交互解读_第1页
第1页 / 共27页
人机交互解读_第2页
第2页 / 共27页
人机交互解读_第3页
第3页 / 共27页
资源描述:

《人机交互解读》由会员分享,可在线阅读,更多相关《人机交互解读(27页珍藏版)》请在装配图网上搜索。

1、人机交互技术是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话、交换信息的技术。人们可以借助键盘、鼠标、操作杆、位置跟踪器、数据手套等设备,用手、脚、声音、姿态和身体的动作、视线甚至脑电波等向计算机传递信息;计算机通过打印机,绘图仪、头盔式显示器、音频等输出设备或显示设备给人提供信息。目前,人机交互技术正处于多通道、多媒体的智能人机交互阶段,已经取得了不少研究成果,不少产品已经问世。侧重多媒体技术的有: 触摸式显示屏实现的“桌面”计算机,能够随意折叠的柔性显示屏制造的电子书,从电影院搬进客厅指日可待的 3D 显示器,使用红绿蓝光激光二极管的视网膜成像显示器;侧重多通道技术的有:“汉王

2、笔”手写汉字识别系统,结合在微软的Tablet PC操作系统中数字墨水技术, 广泛应用于 Office/XP 的中文版等办公、 应用软件中的 IBM/Via Voice 连续中文语音识别系统,输入设备为摄像机、图像采集卡的手势识别技术,以 IPHONE手机为代表的可支持更复杂的姿势识别的多触点式触摸屏技术,以及 IPHONE中基于传感器的捕捉用户意图的隐式输入技术。人机交互技术领域热点技术的应用潜力已经开始展现 ,比如智能手机配备的地理空间跟踪技术, 应用于可穿戴式计算机、 隐身技术、 浸入式游戏等的动作识别技术,应用于虚拟现实、 遥控机器人及远程医疗等的触觉交互技术,应用于呼叫路由、家庭自动

3、化及语音拨号等场合的语音识别技术,对于有语言障碍的人士的无声语音识别,应用于广告、网站、产品目录、杂志效用测试的眼动跟踪技术,针对有语言和行动障碍人开发的“意念轮椅” 采用的基于脑电波的人机界面技术等。热点技术的应用开发是机遇也是挑战,基于视觉的手势识别率低, 实时性差,需要研究各种算法来改善识别的精度和速度,眼睛虹膜、掌纹、笔迹、步态、语音、唇读、人脸、 DNA等人类特征的研发应用也正受到关注,自然语言理解虽然目前在语言模型、 语料库等方面有进展外, 仍将是人机交互的重要目标,多通道的整合也是人机交互的热点,另外,与“无所不在的计算”、“云计算”等相关技术的融合与促进也需要继续探索。人机交互

4、技术与计算机始终相伴发展, CPU、 GPU的运算能力日趋强大,网络和通信技术的快速发展, 显示技术的重大突破都将为人机交互提供新的起点与高度。也许有一天,你的房间的墙壁和窗户都是基于 PLED技术的巨型显示器,无需遥控器和控制器,游戏机或电视机就能“感应”到你目光的变化、捕捉到你的手势和动作、听懂你语音的命令,用你的头、手、足、躯干就可以控制游戏中的角色。互联网正在向“云端”计算时代发展,人机交互的发展仍将延续由以计算机为中心的复杂交互向以人为中心的简单、自然交互转移的理念, 理想的人机交互模式就是“用户自由”,将来,能听、能看、能说、能感觉的计算机会看不见,而计算会无所不在, 不可见的人机

5、交互也会无所不在,就像我们时刻呼吸着的氧气一样。多媒体时代的人机交互语音识别在计算机进入到多媒体时代后, 新的人机交互方式又涌现而出。 语音识别便是一种。这种交互方式在生活中已经随处可见。 在今天人们使用的手机上早已可以利用语音执行操作,不仅如此,手机甚至还能合成语音输出结果。在当前流行的计算机中, 稍微高端一点的手机, 基本都有语音控制的功能, 通过语音控制,人们只需要对着手机说出通讯录中的人名, 手机便会自动拨号。 手机上的其他功能也可直接用语音说出指令进行操作。 但是受手机运算性能所限, 想要通过语音实现短信的文字输入,仍未完全实现。手机的体积非常小, 输入和输出设备都非常不便, 另一方

6、面利用声音进行人机交互的方式几乎不用学习就能很快上手, 因此语音输入被认为是最好的人机交互方式,并且代表了未来的趋势。 因此本文在开篇之时, 用了大量文字论述手机的广泛应用。2007 年 4 月 20 日,比尔盖茨在英特尔开发者论坛上表示,未来语音识别技术将彻底取代键盘。他的理由是在未来人们将会越来越习惯通过语音和指控屏来与计算机交流,而不是通过键盘,因为这种方式更加简便。在随后的一次演讲中,他说:“这(语音识别技术)是我们最大的赌注之一。”事实也的确如此,微软早在其刚被淘汰不久的操作系统 Windows XP中便已将语音识别技术集成了进去,由于并未进行大力宣传,因此大多数用户并不知道。虽然在

7、计算机上实现文字的输入却早已实现,可是局限性也同时存在。大约在2001 年的时候,我和几个朋友在无意间获得了一款 I BM的语音识别软件,那个软件的名字叫“ Via Voice ”。通过这个软件,在经过简单的适应性训练之后,便可以对计算机实现各种控制, 还能输入文字, 如果发音足够标准, 输入的准确率将非常高。 但我和小伙伴们在新鲜几天后, 便发现这个东西其实并不使用, 甚至非常麻烦。中国人常说某人口才或者文笔好的词语是:出口成章。意思是某人说出来的话,非常连贯,不需要修改便是一篇很好的文章。 口才好的人永远是少数, 绝大多数人无 法做到出口成章,至少我不是这样。在写本文的时候,每一句都在写作

8、的同时修改。如果用鼠标配合键盘对文字进行修改, 我很清楚,知道应该如何操作,但是如果 想用语音识别技术,仅用语音去控制计算机进行文章的修改将是非常繁琐的事情, 因为我必须说诸如: “将鼠标移动到 ”之类的话。 而且在文字输入的过程中, 计算机将可能难以识别操作者的部分语音控制命令的真实意图,例如关键字“删除”、“关机”和“取消”等。语音识别技术所面临的问题绝不是仅此而已。 还有更多问题仍是语音识别技术所面临的问题。例如隐私问题, 人需要控制计算机就需要发出声音, 而计算机输出语音也会发出声音。在今天,人们越来越重视个人的隐私,但是用语音进行人机交互,除非是在个人私密的环境下,否则很难保护个人隐

9、私。想想看,在一个几百人办公的大办公室内, 所有人都对着计算机说话, 那将是一件多么滑稽的事情, 而且话说多了, 其实也是一件非常劳累的事情, 至少将会使人口干舌燥。因此,在未来,语音识别想要彻底取代键盘,成为最主要的人机交互方式,可能性不大。他最多只能是现有鼠标加键盘人机交互方式的补充而已。霍金的轮椅眼睛控制鼠标史蒂芬威廉霍金是当今最著名的科学家, 他在理论物理领域有深入研究, 被认为可以与爱因斯坦齐名。霍金在 21 岁的时候患上了“肌肉萎缩性脊髓侧索硬化症”,该病症很快便导致他全身瘫痪,从此轮椅相伴、痼疾缠身。也许正是由于其身患残疾, 因此不会被外界干扰, 所以才获得举世瞩目的大量科学成就

10、。为了能够让霍金与其他人交流, 专家们制造了一块拼写板, 帮助霍金和其他 人交流。交流时,需要有一位人指着英文字母, 当指到霍金所要的字母时,就会扬起眉毛,逐个拼出词汇然后连成句子。这样交流方式的速度可想而知。后来美国加利福尼亚一位名叫的瓦特沃尔托兹电脑工程师帮霍金走出了困境。他送给了霍金一段自己编写的名为“平等器”的电脑程序, 这个程序可以让霍金从屏 幕上选择词汇,只要他按动手中的开关, 单词转入语言合成器发出声音来。后来,剑桥调节通讯公司的大卫梅森又改进了这套设备, 并安装在了霍金的轮椅上,使 霍金“说话”的速度大大加快, 每分钟可“说”出 15 个词,如果需要还可以把文字直接打印出来。我

11、们可以发现, 霍金的这种选词方式与鼠标的区别不是很大, 后来随着霍金病情的加重,连手指也不能动作了, 无法再用手控制计算机, 只好依靠其他方式与人沟 通。于是科学家们在霍金的眼镜上,大约距右颊一英寸的地方,安装了一块可以侦测肌肉活动的红外线发射器及侦测器, 当霍金想打招呼,说“ Hello ”时,眼 球控制红外线感应器,选定在荧幕上轮流出现的英文字母,当屏幕出现他想要的“”时, 霍金再动眼球, 这样计算机就会不断显示以“”为字头的英单词,当 “Hello ”出现时,他只要再动一下便可以选定“ Hello ”,然后接着选择下一个单词, 在整句话完毕后, 计算机便会将霍金用眼球控制计算机造出的句子

12、 传至合成器发出发声。霍金这种用眼球控制计算机的技术也被用在了其他更多方面, 例如日本佳能公司生产的高端相机就可以利用眼球来控制相机的对焦点。我们在使用自动对焦相机拍照的时候都知道, 在相机里有一个对焦点, 当我们在拍照的时候需要把这个对焦点对准目标, 然后轻按快门,相机便会完成自动对焦,接着将快门按到底便可完成整个拍照过程。我们需要用手动调整相机里的对焦点到合适的位置才能拍照。 可是美丽往往只在瞬间,因此经常发生等调好了对焦点, 精彩的瞬间已经永远流逝。 或者来不及调整对焦点,当按下快门后,冲洗出来的照片却发现是虚的。如果能从取景框里看到什么, 相机便自动以眼睛所看的目标为对焦点, 那多好?

13、佳能公司早在生产 EOS5 的时候,便满足了人们的这一需求。该款相机可以依靠其独特的仿生构造,依靠眼睛控制来控制自动对焦功能。在 EOS5 中的取景目镜下方装有四个红外线发光二极管, 发出红外线对向取景器窥视的人眼照射, 再通过目镜与五棱镜之间的分束镜和聚焦透镜, 将反射光投影在一块 6 千 像素的 CCD 面传感器上。机内的 CPU对眼球像瞳孔的中心和角膜表面反射光的成像的对位置进行运算,得出眼球的回转角度, 从而得到拍摄者的视线投向取景器 中的位置,然后选择最为接近的自动对焦框,并以此为主要聚焦点进行自动对焦。简单来说就是拍摄者的眼睛在取景框中看着什么目标时,相机便会自动将其作为对 焦的焦

14、点。这种功能对于新闻摄影尤其适用, 因此很多专业的摄影记者, 特别是体育记者都会使用佳能的这个功能更方便的在瞬间对焦, 摄影记者只需要在取景器里看着目标,相机便能瞬间知道拍摄者正在注视的目标完成自动对焦, 而无需先调整焦点才能按下快门。这种用眼睛进行定位的技术也早被使用在了战斗机飞行员的头盔上, 当飞行员想要攻击目标时,只要看见目标,瞄准系统便会自动锁定。这种使用眼睛进行目标选定的功能, 在未来如果用到计算机上将会非常适用。 既然我们的眼睛总是跟着鼠标的光标而移动, 为什么不能让光标自动跟着人的眼球移动 呢?当我们用鼠标的时候,便只剩下一只手去操作键盘了。你能用单手敲击键盘吗?显然效率会降低很

15、多, 既然这样为什么不用眼睛来控制鼠标。 将我们的双手解放 出来呢?这将是多么方便的一件事情啊!既然如此,相信在不远的将来,这项技术将会被应用在计算机上。今天当我们使用计算机时, 必须输入密码, 除非你并不重视个人隐私。 在许多场合,我们需要对自己的身份进行识别,乘飞机需要身份证,开车需要驾照,取款需要 银行卡,这些都是对我们身份进行识别的过程,这种识别都需要被识别人凭借一定的物理介质和密码。 在未来,通过互联网远程身份对比和生物识别技术结合,将会 有很大改进。指纹识别前几天,我在北京报名学车了,惊异的是,驾校竟然采用了指纹识别。据称,这是为了避免有的人蒙混过关。 因此,相关部门规定学员在上课

16、前和每天学完规定的汽车驾驶课后,都必须用指纹进行签到确认。不用我多说,你应该知道世界上没有2 个人的指纹是相同的。不过遗憾的是,我第一次去采集指纹的时候却不是那么顺利。 我站在队列的中间,在我之前有很多人前去采集指纹, 有的人比较顺利, 能很快被成功采集, 有的人则经过数次采集也无法成功, 这时我暗自嘲笑, 怎么这么笨呢?我的笔记本上采集指纹就非常容易啊。不会这么难的。很快轮到我采集指纹了, 比我预想的要糟糕很多。 和其他大多数人一样, 我竟然采集了十余次都失败了!我有这么笨吗?于是我拿开手指, 仔细观察了一下指纹采集器, 一个红色的透明玻璃板。 我突然回想起,当我在笔记本上进行采集时, 是将

17、手指滑过一个大概 0.3x2CM的扫描 设备。但如果只是将手指按在玻璃板上, 只能采集到我手指的一小块指纹, 因此将无法全部采集到。 如果我将手指放上去, 然后滚动按压指纹是否可以被顺利采集到 呢?和我预想的一样,我的指纹被成功采集了。 我愉快的将这个小发现告诉了所有人。事后我想为什么那个指纹扫描设备不能使用凹陷下去呢?但截止目前还没见到过这 样的设备。目前想要扫描一个立体的图形,技术成本仍然很高,而且这种采集设备的价格也非常昂贵,被广泛使用仍需要较高成本。尽管指纹识别的准确率仍不是非常高, 但仍有很多地方采用了这项技术, 例如在门禁系统上,人们可以使用指纹进行安防识别,进行上下班的考勤。在金

18、融系统,这种技术已经得到了成熟应用,例如 2007 你那,北京的农村商业银行率先开通了一种名为“金凤凰网银”的业务, 是首家被中国银监会批准“使用指纹识别数字证书技术进行客户身份识别的网上银行”这个系统使用了一个指纹识别设备, 将指纹和银行卡账号相匹配, 使用者在登陆网上银行的时候,只需使用指纹进行身份识别后便可登陆网上银行。不仅如此,指纹识别的技术还被使用到了自助缴费终端上, 只需使用指纹对自己身份进行识别便可以进行缴纳水、电费,办理转账及预约存、取款等交易。这种身份识别系统还被应到了自动柜员机上, 从此再也无需携带银行卡便可以在 ATM机上凭指纹存、取现金了。更方便的是, 在上海的一些超市

19、, 人们已经甚至可以不必携带银行卡, 直接使用指纹进行购物时候的货币支付了。已经被广泛应用的指纹识别系统也是人机交互的一种方式。自从有了指纹识别,我们不用再记住复杂的密码了, 在需要身份识别的地方只需要手指往上一按便可以了。不过这种技术显然无法取代键盘或者鼠标, 他只能成为人机交互系统的辅助识别系统。尽管指纹识别很方便, 但到现在我仍更喜欢使用密码, 因为我很担心自己如果手指脱皮会不会使笔记本再也不认识我了。事实上,指纹识别系统并不十分安全,我们在美国影片国家宝藏中便看见指纹很容易便被他人复制并且使用。比指纹更安全的是虹膜识别,他是利用人眼中的视网膜进行识别。虹膜识别虹膜这个名词你一定不会陌生

20、,不过可能有少部分人仍不知道虹膜到底是什么。它其实就是我们用肉眼所能看到的眼球的那一部分, 虹膜的中心有一圆形和眼球其他部分不一样颜色的开口, 称为瞳孔, 犹如相机当中可调整大小的光圈, 里面的色素决定了眼睛的颜色。人类眼睛的虹膜与手指纹一样, 是独一无二的。 因此,英国剑桥大学的约翰多曼博士才有机会发明了虹膜身份测定技术。一个虹膜大约有 266 个单位的读取点, 而其他传统生物测定技术只能读取 13-16 个单位。因此虹膜识别技术要更加精确, 另外由于虹膜技术相比较起指纹, 不容易被复制,因此防伪性能更好。但是指纹和虹膜识别都有一个缺陷, 需要人直接接触或者靠近识别设备, 并且要做短暂停留,

21、因此在使用上仍然有一定局限性,在某些场合并不十分适用。人脸识别大概在 2 年前,我前往人民大会堂开会的时候, 无意间发现了一种人脸识别的设备,他可以通过摄像头将人的脸部拍摄下来, 然后和存储中的相片进行比对, 以确定其真实身份。这种识别技术显然要比指纹和虹膜识别的技术要快速和方便很多。人的眉骨、鼻梁、颧骨等都是人面部骨骼的基本结构, 在这个三角区能构成无数个集合图形,每个人的骨骼会有不同的细微差别, 因此每个人在该区域构成的几何图 形都不一样。这便是人脸识别系统的技术原理。即使是人变胖或者变瘦几十斤,甚至变得依靠肉眼都无法辨认出来, 由于人的骨骼不会发生变化, 因此仍能被人脸识 别系统敏锐的“

22、目光”发现。在已经召开的 2008 年北京奥运会上,这种人脸识别技术得到了更广泛适用。据说在北京奥运会期间, 出入各比赛场馆的任何人都会被人脸识别系统拍下脸部画面 和系统中的可疑人物进行对比。该系统可以从人群中快速辨认出可疑人物,以防止其进入敏感区域。 只要可疑人物经过摄像头下方,无论乔装打扮成什么样子,只要 被拍摄到其 15 以上的面部信息,便可以显示出被拍摄者的详细信息。在该系统中,将有 10 多亿人的信息被存储到奥运场馆人脸识别系统数据库。届时奥运会时每个比赛场馆安装的探头数量将达数百甚至数千个, 并全部和这套人脸识别系统相连,以确保奥运会安全。在奥运会上,这套人脸识别系统为平安奥运做出

23、了巨大贡献。姿势识别在北京首都机场 1 号航站楼,一楼至二楼的楼梯旁边有一个使用投影做的互动游戏。这些游戏都是通过人的身体动作来控制。 例如在玩足球游戏的时候, 投影中会有一个足球的影像被投到地面, 人只要用脚触碰到画面中的足球, 便能像真实生活中踢足球一样控制足球移动。这便是姿势识别的一种。 不仅如此,姿势识别也能像指纹和虹膜一样, 进行身份识别,据科学家的研究说, 这种技术可以达到 80%-95%的识别率。其实,我们 在生活中,也经常能通过他人走路的身影分辨出是谁。 这是因为, 每个人走路的姿势都会有所不同, 有的人走路时总是昂首阔步, 有的人则会拖着脚走, 还有的人走 路却总是显得软弱无

24、力。所以科学家们正在开发一种安全系统,使计算机扫描人走路姿势扫描, 再加上其它的生物学统计技术如对面部和眼睛或者指纹的识别技术, 从而有效的辨别他人的身份。触摸屏技术在今天,触摸屏技术的使用范围已经非常普遍。 特别是在手机中的使用, 更是非常广泛。苹果公司推出的 iPhone 手机由于大量使用了触摸屏技术,酷酷的人机交互界面令人耳目一新,使其迅速被用户广泛推崇。有了触摸屏技术, 人们可以用手指在电脑屏幕上直接操作, 而无需鼠标。 人们只需要将指尖直接碰触需要按的位置,便可按照操作完成操作。触摸屏技术使手指彻底代替了鼠标, 甚至有的触摸屏利用模拟在屏幕上显示键盘的方式直接代替了键盘,例如 iPh

25、one 手机便在其手机屏幕上模拟了一个键盘,用户只需要使用手指的拇指前端触摸屏幕,便可完成文字的输入。尽管 iPhone 手机的屏幕很大,但当使用指头触碰键盘的时候,由于手指比目标按钮区要大许多, 因此经常会发生输入错误的现象, 在进行中文输入时, 错误率更高。许多人认为这是 iPhone 手机设计的一大缺陷,但在其 2008 年 6 月推出的 3G版 iPhone 手机中并没有对该问题进行改进,因为在许多早已经使用了触摸屏技术的手机上都被另外配备了一支笔, 这使用户可以使用笔进行跟准确的定位, 有效降低了错误率。目前常见的触摸屏有:电阻、电容、红外线和表面声波等几种技术原理。电阻触摸屏的主要

26、部分是一块与显示器表面配合非常紧密的电阻薄膜屏, 这是一种多层的复合薄膜, 由一层玻璃或有机玻璃作为基层, 表面涂有一层叫 ITo 的透明 导电层 , 上面再盖有一层外表面硬化处理、 光滑防刮的塑料层, 它的内表面涂有一层导电层( ITO 或镍金) , 在两层导电层之间有许多细小(小于十分之一英寸) 的透明隔离点把它们隔开绝缘。当手指触摸屏幕时,两层导电层在触摸点位置就有了一个接触,控制器侦测到这个接通并计算出 X、Y 轴的位置,进行定位。电容技术的触摸屏是一块四层复合玻璃屏, 和电阻触摸屏原理类似, 玻璃屏的内表面和夹层各涂有一层 ITO(纳米铟锡金属氧化物),它有很好的导电性和透明性,在屏

27、幕的最外层还有一个 0.0015 毫米厚的矽土玻璃作为保护层,夹层中的 ITO 涂层便是工作面,屏幕的四个角上会引出四个电极。当用户在用手指触摸电容屏时, 由于人体本身具有电场, 因此手指头和工作面会形成一个耦合电容,工作面上的高频信号会被手指头吸收走一部分很小的电流。这个 电流分别从触摸屏四个角上的电极中流出,流经这四个电极的电流与手指到四角的距离成比例, 控制器可以通过对这四个电流比例的精密计算, 得出触摸点的位置。苹果 iPhone 手机使用的便是这种技术,因此当用户在使用触摸屏的时候,只能用手指头,连指尖都不行,手指头的面积较大,因此就不能准确定位了,但是这种定位技术却非常迅速和精确,

28、只是 iPhone 手机的屏幕太小。红外触摸屏是利用X、Y 方向上密布的红外线矩阵来检测并定位用户的触摸。通常红外触摸屏在显示器的前面安装一个外框,靠藏在外框中的电路板在屏幕四边排布 红外发射管和红外接收管,一一对应形成横竖交叉的红外线矩阵。用户在触摸屏幕时,手指就会挡住经过该位置的横竖两条红外线,从而判断出触摸点在屏幕的位置。表面声波是超声波的一种, 他是在在介质 (例如玻璃或金属等刚性材料) 表面进行浅层传播的一种机械能量波。 表面声波性能稳定、 易于分析, 并且在横波传递过程中具有非常尖锐的频率特性。表面声波触摸屏的触摸屏部分可以是一块平面、球面或是柱面的玻璃平板, 安装在 CRT、LE

29、D、 LCD 或是等离子显示器屏幕的前面。这块玻璃平板只是一块纯粹的强化玻璃,区别于别类触摸屏技术是没有任何贴膜和覆盖层。玻璃屏的左上角和右下角各固定了竖直和水平方向的超声波发射换能器,右上角则固定了两个相应的超声波接收换能器。玻璃屏的四个周边则刻有 45 度角由疏到密间隔非常精密的反射条纹。因此可以进行准确定位。触摸屏技术在未来, 将被越来越广泛的使用, 当仍只是目前的传统人机交互方式的补充。平板电脑和 Windows72002 年,微软公司和数家硬件公司合作,推出了一种全新用户体验的计算机:平板电脑 (Tablet PC) 。但过高的价格使其并未被广泛普及,虽然微软的合作伙伴们均生产了平板

30、电脑,但价格却是同一时期内的最贵笔记本电脑。平板电脑,实际是预装了微软 Windows XP Tablet PC 版,使用触摸屏技术的笔记本电脑。他的核心技术是数字墨水技术。 使用这种电脑, 人们可以直接在电脑屏幕上进行绘画, 或者按照自己平时书写文字的习惯写字, 电脑会将书写的笔迹完全记录保存下来,并可以在最后整理。平板电脑的这种使用方法, 其实并不陌生, 因为在高档手机之上, 我们早已熟练使用。 iPhone 的流行,使人们对触摸屏的技术更加感兴趣,第一次发现原来触摸屏可以这么好玩。平板电脑,虽然具有触摸屏技术, 但是在本质上仍是一款传统的电脑, 外观上最大的区别是, 屏幕可以进行 180

31、 度的翻转, 使用户更方便的在触摸屏上, 用电磁笔 进行文字书写。但这样使用电脑触摸屏, 手指总会在屏幕上留下指头的痕迹,甚至不小心将屏幕划伤。 大多数的时间中, 人们仍然是在桌子前, 因此键盘仍然是平板 电脑不可缺少的必须配件。微软即将在 2010 年推出的 windows 7 操作系统中,已经将触摸屏技术全面引入操作系统,微软预计到那时候,由于成本下降,计算机的运算速度也将越来越快,触摸屏技术将成为计算机特别是笔记本的标准配置。在今天,当我们站在大屏幕前演讲时,只能借助激光笔对重要的内容进行圈点,控制 PPT的翻页。许多演讲人在兴致高时, 总会站在大屏幕前, 直接对 PPT的内容,用手进行

32、指示,但会挡住投影的内容,非常不便。在显示器可以被做的越来越大的今天,触摸屏更易在展示中起到作用,例如中国中央电视台的世界周刊节目就将这种触摸屏技术应用到了节目的演播之中。 节目中,主持人可以用手指随意拖动、 放大、缩小或者选取图案和素材, 展示给观众。这种全新的节目表现方式令观众耳目一新。人与机的对话浅谈人机交互的人机关系及其发展趋势2009-03-11 10:27:23|分类:IT | 字号订阅摘 要人机交互作为一门独立学科,带来了与传统媒介大不一样的传播方式的革命,人们开始充分利用它的交互性创造用户与计算机之间的 有意义”的联系。本文依据人机交互的发展现状, 通过新旧媒体与人的关系对比分

33、析,体现出新媒体在互动方面的优势,预测人机交互的发展趋势, 展望未来人机交互的发展前景。由于技术的提高及设计的人性化,未来人机交互将综合多种技术,界面自然,操作简便并应用在生活中的各个领域- 人机互动,将无处不在!关键词:人机关系以人为本多通道互动智能互动引言随着科技的不断发展,计算机的出现引发关于“人机交互” 的研究已经有半个世纪的历史。从最早的二进制大型计算器到现在的虚拟现实,如今全世界的高科技领域精英们都在为人机交互的发展和前进不屑努力,且已经使人机交互走向了更广阔的应用空间。本文通过简要的回顾, 和计算机这种新媒介与传统媒介的对比,分析人机关系, 并基于目前科技的发展现状展望人机交互的

34、发展前景。一、人机交互概况1、什么是人机交互?当今,关于人机交互的研究已经成为世界上的一大潮流, 关于人机交互的讨论也随处皆是,那么,到底什么是人机交互呢?简单的说,就是人与计算机的互动,科学的说,人机交互CHI(Computer Human Interaction)是一门跨学科的研究,国际上也称(HCI, HumanComputerInteraction) ,它的研究内容很广,包括心理学领域的认知科学,心理学;软件工程领域的系统构架技术;信息处理领域的语音处理技术和图像处理技术;人工智能领域的智能控制技术等。总的来说, 人机交互本质上是认知过程,人机交互理论是以认知科学为理论基础;人机交互系

35、统是一个闭环系统,人机交互研究是以系统科学作为人机交互研究的框架的方法学;同时,人机交互是以信息技术作为用户界面的技术基础,通过信息系统的建模、 形式化描述、整合算法、评估方法以及软件框架等信息技术最终实现和应用人机交互理论。引自北京大学计算机系人机交互与多媒体研究室简介2人机交互的发展历史人机交互是随着科技的不断发展而发展的, 自从计算机出现以来人机交互技术经历了巨大的变化。总体来看,它是一个从人适应计算机到计算机不断的适应人的发展史:(1)人适应计算机早期的手工作业阶段, 计算机是现在看起来十分庞大笨拙的二进制计算机,使用者既设计者必须使用计算机代码语言和手工操作的方法。作业控制语言及交互

36、命令语言阶段,计算机的主要使用者 (程序员) 可以通过记忆许多命令和敲击键盘,采用批处理作业语言或交互命令语言的方式来调试程序、了解计算机执行情况。(2)计算机适应人到了图形用户界面 (GUI)阶段,由于可以直接操纵而无须掌握复杂的计算机语言,不懂计算机的普通用户也可以熟练地使用,大大的拓宽了用户群, 使信息产业得到空前的发展,计算机适应人的序幕正式拉开。科技进一步发展, 网络用户界面的出现增强了人机交互,基于超文本标记语言 HTML 及超文本传输协议HTTP 为主要基础的网络浏览器是网络用户界面的代表, 由它形成的 WWW 网已经成为当今Internet的支柱。 同时新的技术不断出现:搜索引

37、擎、网络加速、多媒体动画、聊天工具等都使人机交互上升到一个更高的境界。多通道、多媒体的智能人机交互阶段是真正人机交互的开始。当前计算机的两个重要的发展趋势是计算机系统的拟人化和计算机的微型化、随身化、嵌入化。如虚拟现实、手持电脑、智能手机等。单纯视觉通道的交互方式已向多通道交互方式转变,人机交互已经更为人性化,操作亦向自然、高效的方向发展。二、人机关系人机交互是在两者之间 (无论是生命体还是机器) 连续作用和反应的过程。 交互性是人际领域和传播媒介的基石, 也无疑是我们文化的关键点之一。 它使人类沟通浸染了媒介最显著的特色时间和空间的无穷变异性1 。勿庸质疑,人机交互的核心就是交互性,它决定着

38、人与机的关系。 和传统的媒介相比, 计算机和人产生的交互更为深入广泛, 那么我们就来分析一下新旧媒介和人的交互关系有何异同:1、传统媒体与人的关系:所谓传统媒体既报纸、杂志、电视、电话等信息传播媒介。就以报纸为例来看,如图一所示,信息的传播者甲将信息A 发布于媒体,当乙接触到媒体便成为信息A 的接收者,接收者再对信息做出反馈B(如读者来信选登等)通过媒体反馈给甲,此时便完成了一个交互的过程。 整个过程中, 传播与反馈的信息都是定量的而非变量。那么,在这一过程中媒体的两边是信息的发出者和接受者,媒体就像一个桥梁连接二者, 这种连接可以是跨越时空的。既,发出者和接受者可以处于不同的空间,同时或不同

39、时完成交互过程;亦可以处于相同的空间在相同或不同的时间里完成此过程。但是传统媒体是有一定局限性的。它不是一种实时的交互, 有时甚至只有单方动作的发出而没有受众接收后的反馈渠道,严格意义上讲不成为互动, 即使有也不是实时的,这是传统媒体本身的局限性。从本质上来讲,这种交互其实是人与人之间的互动,媒体只充当被利用的承载工具,并没有与人发生交互。人与机的对话浅谈人机交互的人机关系及其发展趋势- dhp_blog-dhp_blog 的博客2、新媒体与人的关系:新媒体主要指基于计算机技术的新形式媒介,它除了具有传统媒介所具有的跨越时空性,更大的特点是具有智能性和交互双向性。 新媒体的交互可分为两类: 一

40、是与传统媒体本质上没有区别的交互形式,如网站、网络聊天、电子邮件等,只是换了一种媒体而已,本质还是人与人的交互,分析同上; 另一种是人机双向交互,如网络游戏、 脱机游戏、 电子宠物、虚拟现实等,媒体不再是单纯的承载工具,而变成为交互的主体:以网络游戏为例,如图二所示,当设计者甲设计好一个软件既传达一种规则A 给计算机和玩家乙,一旦玩家乙对计算机产生动作 X,一个人与机的对话就开始了(此时甲成为一种前提存在而不参与到互动中来)。由于计算机的智能性可以对动作发出者的行为做出智能运算并做出反应,出现的结果是设计者和使用者都未知的。当乙动作于计算机, 计算机通过智能运算, 形成了新的信息并针对乙发出的

41、动作 X 做出反应 Y,乙接受到的已经不再只是A,而是由 A 和 X 共同作用下产生的智能化的结果变量Y。乙收到 Y 后的反馈为 X,它是由 A,X,Y 共同作用的结果;计算机对 X的反应为 Y,如此往复形成一系列有传承关系的交互。当媒体和乙再反馈给设计者甲时,甲收到的是分别来自媒体和乙的反馈B、 C,当他将 B、 C 总结应用到开发新一代软件时他变成了甲 ,投入使用后将出现媒体和乙 形成新一轮的交互。 值得注意的是,甲变为甲是在第一重人机交互过程反馈后的第二重人机关系,是具有时间性的。 总的来看,这个交互的过程中甲和乙是分别和媒体交互的,媒体已经跃升为交互的一方和人的关系是平等的,都是交互的

42、主体。人与机的对话浅谈人机交互的人机关系及其发展趋势- dhp_blog- dhp_blog的博客综合来看, 传统媒体的交互本质是人之间的交互,人与媒体的关系是不平等的利用与被利用关系, 传递的信息量是定量;新媒体的交互在传统媒体交互上又发展了一步,其本质是人与计算机之间的交互,人与媒体的关系是平等的,它反映的不是交流双方的主客体关系,而是一种“等同关系” :机器不仅仅是工具,也是我们社会的积极参与者2 。三、人机交互的发展、变化1、以人为本前面我们已经简要回顾过人机交互的发展历史,人机交互和计算机用户界面已经渡过了基于字符方式的命令语言式界面的阶段, 目前正处于图形用户界面时代, 将来的发展

43、趋向于以人为本的自然和谐的交互。 人机关系中计算机对人的互动 (既图二中计算机对人的动作反应变量 Y)将被更加发扬光大,交互形式将利用人的多纬度感知开发出多通道同时作用的人性化交互,以及交互中非精确语言既模糊语言的运用,实现真正意义上的人机交互。2、多通道互动由于技术方面输入设备键盘、鼠标的限制, 具有高效交互性的多通道媒体交互还不能普及,人机的交互也多在此划开了分界(如图一和图二所示),但在很多领域,工程师和设计师们已经做出多方探索, 使人们看到了高效的自然人机交互的曙光。我们已经看到, 基于人的感觉(如视觉可看可注视,手可控制、可触及等)开发的效应通道的出现和应用。如视觉方面的视线跟踪系统

44、, 目前外国部分科学家已经利用这种技术研究受测者的心理,相信在不久的将来这会不只应用于心理学研究,甚至可以取代鼠标在界面上简便、直接、快捷的选取感兴趣的信息;听觉通道可以利用三维听觉定位器(3D AuditoryLocalizer)、分贝感应器、语音识别系统、 声音与画面相互转化;触觉方面的感光、 感压技术为实现自然交互界面提供更多可能。意大利蓝色工房的艺术作品中就有较多运用,如“是什么触动了我”,当人走在可以感应光影的屏幕上会触动屏幕里躺着的人翻身扭动(图三、图四)。带有触摸屏的手机和电脑就是利用感压技术实现的。它的好处是使用户避免了生硬不自然的、频繁耗时的通道切换从而提高自然性和效率。 现

45、在,还有一些利用人的其他生理现象实现的的交互形式,比如脉搏、心脑电波、 出汗、 肾上腺素等。笔者见过的一个中国艺术家的互动作品既是采用医用测脑电波仪捕捉两名游戏者的脑电波,第一关是谁的脑电波强度越大,屏幕里相应颜色的荷花就开的越多, 直到开满屏幕进入下一关,谁先钓到指定数量的鱼谁就胜出,游戏既结束。它运用的就是将脑电波用图象来表现的技术, 从而形成了一个有趣的游戏。 而现在出现的智能健身器就是在脉搏感应记数等方面开发的互动产品。前些年有科学家利用仪器捕捉到一种由人脑发出的微粒,研究成果表明人的大脑在思考时会发出一种极其微小的微粒(远小于原子),可以在瞬间移动到数公里以外,而敏感的人会对这种微粒

46、做出反应,如打喷嚏或出现说曹操曹操到的现象(实际上是曹操将要来A地,思想微粒先于他到, 敏感的人接收到这种讯息就谈到曹操,在谈的过程中曹操正好赶到)。笔者认为当技术发展到一定程度,捕捉这种思想微粒就像捕捉手机信号一样容易时,我相信结合以上几方面的技术利用三维显示界面的虚拟现实技术,人机交互的操作将是更随意、更简便、更自然、更广阔的发展空间。人与机的对话浅谈人机交互的人机关系及其发展趋势- dhp_blog - dhp_blog 的博客3智能互动自从深蓝的胜利打响了人机大战的第一炮, 智能计算机的研究就更加紧锣密鼓的进行着,人机现场和奏即兴乐曲业已实现, 人机交互的发展已经又深入一步。 人工智能

47、的研究无疑加大了人机互动的步伐。 人工智能产物已经服务于各行各业, 人们开始希望人工智能产物可以设计的更具有人的特点, 期待我们的创造物人工智能产品可以主动与我们发生更人性化的智能交流。 也有人担心人工智能一旦具有了人的特点如情绪、 心智等心理特征将会存在与人的可控制范围之外, 甚至反过来控制人类。 但无论怎样, 技术的发展推动着人机关系的发展,人机交互必将向更深层面的交互发展并存在于人类生活的各个角落已是一个必然的趋势,人机的互动将无处不在!结论综上所述, 正如图一与图二直观的对比出新媒体较传统媒体之间的差别,传统媒体只是简单的传递信息,极具互动性的新媒体则是在人机对话过程中又有新信息产生,

48、人的体验也会比接触传统媒体更加丰富、直观、有趣味,机与人的关系更为密切化、平等化,它能达到的交互效果是传统媒体难望其项背的,亦是前人不敢想象的。这就是为什么新媒体从出现以来就在短短的半个世纪里迅速使长久以来传统媒体在人们生活中的主体位置受到威胁,且越来越被更多的人接受的原因了。 无疑的, 新媒体有更大的互动潜力可以挖掘, 我们可以大胆的想象将来人机交互的样子, 也许想象中奇异的情景有一天真的会被高速发展的科学技术实现。其实由于人的智慧是一种不恒定的变量,那么由变量创造出来的变量就更是不可预知的了,但可以肯定的一点是人机交互将成为未来生活中必不可少的一部分,并逐渐扮演更重要的角色。参考书目 1

49、(美) Nathan Shedroff.Experience Design ( M ) .Indiana:New Riders Publishing.2001.2 (美)巴伦李维斯,克利夫纳斯著卢大川等译 . 媒体等同( M ) .上海:复旦大学出版社 .2001.p213.读书的好处1、行万里路,读万卷书。2、书山有路勤为径,学海无涯苦作舟。3、读书破万卷,下笔如有神。4、我所学到的任何有价值的知识都是由自学中得来的。 达尔文5、少壮不努力,老大徒悲伤。6、黑发不知勤学早,白首方悔读书迟。 颜真卿7、宝剑锋从磨砺出,梅花香自苦寒来。8、读书要三到:心到、眼到、口到9、玉不琢、不成器,人不学、不知义。10、一日无书,百事荒废。 陈寿11、书是人类进步的阶梯。12、一日不读口生,一日不写手生。13、我扑在书上,就像饥饿的人扑在面包上。 高尔基14、书到用时方恨少、事非经过不知难。 陆游15、读一本好书,就如同和一个高尚的人在交谈 歌德16、读一切好书,就是和许多高尚的人谈话。 笛卡儿17、学习永远不晚。 高尔基18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。 刘向19、学而不思则惘,思而不学则殆。 孔子20、读书给人以快乐、给人以光彩、给人以才干。 培根

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!