人机交互过程中认知负荷的综合测评方法

上传人:仙*** 文档编号:98452837 上传时间:2022-05-29 格式:DOC 页数:18 大小:256.50KB
收藏 版权申诉 举报 下载
人机交互过程中认知负荷的综合测评方法_第1页
第1页 / 共18页
人机交互过程中认知负荷的综合测评方法_第2页
第2页 / 共18页
人机交互过程中认知负荷的综合测评方法_第3页
第3页 / 共18页
资源描述:

《人机交互过程中认知负荷的综合测评方法》由会员分享,可在线阅读,更多相关《人机交互过程中认知负荷的综合测评方法(18页珍藏版)》请在装配图网上搜索。

1、心理学报2009, Vol 141, No 11, 35-43A cta Psychologica S in icaDO I :10. 3724/SP. J. 1041. 2009. 0003535收稿日期 :2007-11-133 全国教育科学 “十一五 ”规划教育部重点课题 (DCA080141 、浙江省自然科学基金资助项目 (Y604275 、浙江省哲学社会科学规划后期资助项目(08HQZZ038 资助。通讯作者 :许百华 , E 2mail:bhxu305zju. edu . cn人机交互过程中认知负荷的综合测评方法3李金波许百华(浙江大学心理与行为科学学院, 杭州 310028摘要设

2、计模拟网络引擎搜索和心算双任务实验, 分析主观评定、绩效测量和生理测量三类评估指标对认知负荷变化的敏感性; 采用因素分析、 BP 神经网络和自组织神经网络三种建模方法, 探索人机交互过程中认知负荷的综合评估建模方法。结果显示 :心理努力、任务主观难度、注视时间、注视次数、主任务反应时、主任务正确率 6 个指标对认知负荷变化敏感; 采用多维综合评估模型对双任务作业认知负荷进行测量总体上比采用单一评估指标的测量更为有效。BP 网络和自组织神经网络两种神经网络模型对认知负荷的测量结果优于传统的因素分析方法。关键词人机交互 ; 评估 ; 认知负荷 ; 神经网络 ; 建模分类号B841. 21 前言随着

3、计算机和自动化技术的发展 , 人在人机系统中的职能发生了很大变化 , 状态的监控任务 , ( 大加重。、杂人机系统中 , 容易出现认知负荷过高 , 甚至超负荷现象。过高的认知负荷将严重影响人的工作效率、操作可靠性和身心健康, 进而影响整个人机系统的效率和可靠性。因此, 认知负荷已成为人机系统评价的主要指标之一。最早对认知负荷开展研究的是美国心理学家M iller (1956。此后 , 国外一些学者对认知负荷的含义、结构和测评方法进行了大量的研究。Cooper (1990 将认知负荷定义为在特定的作业时间内施加于个体的工作记忆的心理活动总量。Paas和 van Merrienboer (1994

4、 认为认知负荷由多维度构成, 是执行一项具体任务时施加于个体认知系统的负荷。认知负荷目前尚不能直接进行测量, 而只能用间接的方法对其进行评估。常用的评估技术有任务绩效测量、主观评定和生理测量等三大类(Paas &Mer 2rienboer, 1994; B runken, Plass &Leutner, 2003;Faircl ough, Chris, Dan 2iel A lan, 2berg, 2006 。它的基本假设是 , 随着作业难度的提高 , 对人的信息加工资源的需求相应地增加 , 当认知负荷对个体的要求超出其可支配的资源总量时 , 作业绩效将出现不同程度的下降。主任务测量常用的指标

5、有操作准确性、反应时、信号漏失率和虚报率等。次任务测量采用双任务作业情境 , 要求作业者除执行主作业外再完成一项额外的作业 (次作业 , 通过考察双任务作业情境下次作业绩效受影响的程度 (相对于单任务情境 来间接评价主作业的认知负荷。生理测量是通过测定作业者在进行指定作业过程中出现的生理反应来间接地评估认知负荷 , 常用的生理指标有瞳孔直径、心率和事件相关电位等 (Chirs, Daniel &A lan, 2007; Ahlstr om &Fried man 2berg, 2006 。主观评定技术是由作业者根据主观感受与体验来评估认知负荷, 通常涉及个体知觉到的心理努力、任务难度和时间压力等

6、方面。上世纪80 年代以来 , 国外一些研究者相继开发出了多种认知负荷主观评定方法 , 如 Paas和 Van Merrienboer (1994 使用九级评定量表测量被试在理解任务材料上投入心理努力的程36心理学报41卷度, 进而对认知负荷进行评估。 Kalyuga, Chandler和 S weller (1997 使用由作业者自我报告任务难度的方法来测量认知负荷。此外 , Sal omon (1983、Tabbers (2004、 Paul (2006 等也分别提出了相类似的认知负荷主观评定方法。已有的研究表明 , 上述 3 类测评技术各有优点和局限性。例如, 主任务测量比较直接 , 对

7、作业本身无干扰 , 但只在中等负荷水平时较敏感 ; 次任务测量相对比较敏感 , 效度较高 , 但容易对主任务产生干扰。此外 , 任务绩效与认知负荷的关系不一定是简单的线性关系。例如 , Meister (1976 将认知负荷等同于任务需求 , 发现任务需求与工作绩效之间是曲线的关系 ; 而 W aard (1996 则认为 , 任务需求与任务绩效之间呈 “倒 U ”形的关系。主观评定无干扰 , 操作简便 , 但要求被试采用内省的方法来评定负荷水平, 因而容易出现较大的偏差。此外, 主观评定结果与个体特征、认知策略以及个体的心理和生理状况等多种因素有关, 即使同一个人对同样的任务, 在不同的作业

8、时间段也有可能出现不同的评定结果。Paas和Van Merrienboer (1994 卷为例 , 觉 , 的关联程度 , 于任务过难 , (Reed, Bur 2t on &Kelly, 1985 。同样 , Kalyuga, Chandler 和 S weller 使用让个体自我报告任务难度差异方法所得出的结果也很可能是由于所需要完成的任务难度、个体个人能力水平等原因造成的。生理测量指标具有客观性和实时性, 但是它们与认知负荷之间只是间接的联系 , 并且也可能会受到注意或情感等方面因素的影响(B runken, Steinbacher &Plass,2002 。因此 , 由认知负荷引起的某

9、一生理指标的变化可能会被其它因素放大或缩小;而且不同的任务可能会产生不同的生理反应, 一项生理指标对某一类任务适用, 而对另一类任务则可能不适用。一般认为, 不同测评技术分别适用于不同的情境、不同的负荷水平范围。因此 , 利用多种技术对认知负荷作综合评估以替代基于单一方法或指标的评估是比较合理的选择; 同时 , 认知负荷的多维度特性也决定了对其作综合评估的必要性。近年来, 国外一些学者运用多指标综合评估方法在心理工作负荷(Men 2talWorkl oad 的测评中进行了一些探索性研究。这些研究以多个单一评估指标的测量结果作为依据 , 采用一定的建模技术对心理工作负荷进行多维度综合评估。目前在

10、这一领域较常用的建模技术主要有因素分析、回归分析和人工神经网络建模等。例如 , Kilseop 和 Myung (2005 运用主成分分析将三种生理指标(脑电、眼动和心率 和主观负荷组合成一个综合评估指数 , 发现综合指数较单项指标能更准确地区分不同难度任务中被试的负荷水平。此外, 他们还通过回归分析来考察主观负荷与生理指标之间的关系, 以生理指标的测量结果来预测被试的主观评定的负荷状况。人工神经网络简称神经网络, 在国外有关的研究中 , 运用神经网络模型对负荷进行多维度综合评估主要有两种模式。一种模式是将主观负荷、作业绩效指标或生理指标的测量结果作为网络的输入项, 通过建立不同的神经网络模型

11、对负荷进行评估或等级划分。例如 , Roger, Robecca和 Gory (2003 , 收集了 5 个绩效指标作为输入项 BP 神经网络模型 , 66. 9% 96. 0% N (2001 在一项飞行作业的 30 个 EEG 指标的测量 , 然后运用主成分分析法将这些指标归并为少数的几个指标 , 以它们作为网络的输入项建立起自组织神经网络模型。结果显示 , 借助自组织神经网络模型能比较准确地预测信息加工要求不同的任务中负荷发生的变化。此外 , 其他的研究者利用相类拟的方法也得到了较理想的结果 (Laine, Bauer &J r Tef 2frey, 2002; Noel, Bauer

12、&Lanning, 2005; Gr ootjen, Neerincx &Velt m an, 2006; Shayeghi, Shayanfar, 2006; Shayne, Penel ope &Andre w, 2007。第二种模式是将影响负荷的主要因素作为输入项, 通过建立神经网络模型 , 对不同任务难度条件下被试的负荷状况进行评估。例如, D ing 和 Sheue (1999将影响监控作业的跨度(Span 、差异度 (discri m inate 、可预测度 (p redict 和注意转换 (transfer attenti on 4个因素作为输入项建立BP 神经网络对负荷进行评估

13、, 并将神经网络评估结果与负荷上限值进行比较 , 超过上限值就认为是超负荷, 并据此对监控作业过程中的负荷状况进行实时分析和任务的动态分配。但从总体上来看, 国外学者利用神经网络对负荷进行评估或等级划分还处于起步阶段 , 并且已有的研究中 , 任务条件各异 , 神经网络输入变量不同 , 因而所得的结果也难以进行比较。此外 , 有的研究者还运用多层次模糊综合评价方法对负荷进行综合评估研究 (Currie, 1997 。1 期李金波等 :人机交互过程中认知负荷的综合测评方法37在认知负荷综合评估方面 , 国外学者也进行了一些尝试 , 如 Paas和 van Merrienboer (1993 、T

14、uovinen 和 Paas (2004将心理努力与主任务绩效这两类指标结合起来对认知负荷进行综合测评 , 获得了利用单一评估指标无法得到的许多重要信息。他们还发现 , 采用多种技术对认知负荷进行多维综合评估可显著提高评估敏感性。但到目前为止 , 对认知负荷的综合评估研究还是零碎的, 缺乏建模方法的系统研究和不同方法之间的比较研究。在国内, 目前还未见这方面的研究报道。借鉴国外已有的多指标综合评估方法在心理工作负荷测评中的运用 , 本研究拟结合复杂人机系统中视觉信息加工作业的特点 , 通过模拟实验 , 分析主观评定、绩效测量和生理测量三类评估指标对认知负荷变化的敏感性 , 然后基于经筛选的认知

15、负荷评估指标的测量结果 , 分别采用因素分析、 BP 神经网络和自组织神经网络三种建模方法 , 构建双任务作业中认知负荷的多维综合评估模型 , 并对这三种综合评估模型进行比较 , 2 方法2. 1擎搜索 (Chen, , 在计算机屏幕上相继呈现二幅画面, 第一幅画面呈现搜索目标 , 包括要搜索的产品名称和两个指定特征 (如形状、颜色 ; 第二幅画面呈现搜索结果 , 包括 5 个与搜索目标同类型的产品 , 每个产品包含 4 个方面的特征 (如品牌、颜色、形状和价格 。告知被试 5 个产品中有 1 至 4 个符合搜索目标要求的目标项 , 要求被试查找出所有的目标项 , 同时记住目标项的另外二个特征

16、 (如品牌和价格 ; 第二幅画面呈现时间为 16 秒, 被试完成搜索后按键或在 16 秒后第二幅画面消失 , 被试口头报告搜索到的各个目标项的另外二个特征。次任务作业为心算作业 , 即在呈现第二幅画面后随机呈现一个心算问题 , 要求被试作两个个位数相加而后除以3 的心算 , 并对两数之和能否被3 整除在计算机键盘上尽快作出相应的按键反应。主任务分成 3 种复杂水平 , 通过改变第二幅画面 5 个搜索结果中包含的目标项数目来加以控制 , 分别为 5 个搜索结果中包含 1、2 和 4 个目标项 , 代表低、中、高三种主任务复杂水平。实验采用被试内设计 , 每种实验任务条件下实施 8 次搜索和心算作

17、业 , 持续时间约 35m in, 不同实验任务之间休息 3分钟。 2. 2被试45. 5% 、女生 18 名(占共 33 名大学生和研究生参加了实验 , 其中男生 54. 5% ; 被试年龄在 20 至 27 岁之间 , 平均年龄为15 名(占22. 4 岁,所有被试视力正常 , 优势手均为右手。 2. 3 上进行 , 眼动测量采用美国应用科学实验室的 AS L 504 非头盔式眼部跟踪记录仪。实验仪器和测试工具 实验在计算机 (App lied Science Laborat ory, AS L 生产实验中认知负荷主观评定分心理努力和任务主观难度二个方面。心理努力评定采用 Paas等人 (

18、1994 制定的量表 , 经 Paas验证 , 该量表的信度系数为 0. 90(Paas &Van Merrienboer, 1994 。由于 “心理努力 ”是一个专业术语 , , 可能不容易理解 ; 为此 ,完 7 级, 1 7 中选择一 7 努力程度依次递增 , 1 表示 , 表示中度努力 , 7 表示非常努力。任务主观难度采用 Kalyuga, Chandler 和 S weller (1999 制定的量表 , 同样采用 7级评分制 , 从 1 到 7 任务难度依次递增 , 1 表示非常容易 , 4 表示中等难度 , 7 表示非常困难。研究表明 , 使用该量表能够较准确地测查出认知负荷的

19、变化。本研究利用 E 2p ri m e 实验心理专用软件编制程序, 实现主任务、次任务呈现时间的控制和测量相应的反应时等数据。 2. 4 实验程序 实验对每个被试单独进行。实验前 , 被试完成 8 次单任务的心算作业 , 以这 8 次心算的平均时间作为被试的心算作业反应时的基础测量值 (BM 。接着 , 安排被试仔细阅读计算机上呈现的指导语 , 然后进行两次双任务作业的练习 , 主任务为网络搜索作业 , 次任务为心算作业。正式实验中 , 主任务分低、中、高3 种任务复杂水平。在每种任务复杂水平的条件下。被试按指导语进行8 次由网络搜索与心算相结合的双任务作业。实验完成后 , 被试在心理努力和

20、任务主观难度两个量表上对认知负荷大小作出主观评定。主任务的 3 种复杂水平的实验顺序在被试之间做了平衡。2. 5数据收集与整理每一轮实验完成后 , 收集和整理以下一些数据:主任务正确率 :在每次试验后 , 被试准确口头报38心理学报41卷告一个特征就计为一个正确回答, 每种实验任务条件下 8 次试验正确回答的特征数占所有正确特征数的比例就作为该实验任务条件下的主任务正确率。 主任务反应时 :利用 E 2p ri m e 编制的程序自动记录每次试验中从搜索结果页面呈现到被试按键的时间 , 计算被试每种实验任务条件下完成 8 次试验的平均时间 , 以它作为该实验任务条件下的主任务反应时。 次任务正

21、确反应时变化 :在双任务条件下测得的心算反应时间称为被试双任务心算反应时测量值 (DT M 。将 DT M 减去单任务心算反应时测量值, 即 C WR =DTM -BM , 计算 8 次试验中回答正确的C WR 平均值就是次任务正确反应时变化。注视时间、注视次数、眼跳距离和瞳孔直径 :利用 AS L504 眼动仪记录眼动指标数据。眼睛如果在较短的时间 (100m s 稳定在相对的空间阈限范围内 (1 ,速度低于阈限 (每秒15100记为一个注视点。注视点的数量就是注视次数; 每个注视点的平均所占时间就是注视时间; 从当前注视点位置到下一个注视点位置之间间隔长度就是眼跳距离 ; 每次注视时瞳孔的

22、平均大小就是瞳孔直径。心理努力和任务主观难度 :每种实验任务条件结束后用主观评定量表分别获得心理努力和任务主观难度的评估值。 收集到的数据利用 SPSS软件进行分类汇总 , 并进行探索分析 , 去除其中的奇异值。3 结果与分析3. 1 任务复杂性对认知负荷的影响利用 SPSS 软件计算各个认知负荷评估指标在不同任务复杂性条件下的均值 , 并分别对各个评估分析 , 结果见表 1。表 1 评估指标高 MF p心理努力 4. 215. 4821. 130. 002任务主观难度 333. 735. 1520. 140. 003注视时间66. 0183. 3383. 688. 910. 000注视次数

23、283. 82366. 91388. 5518. 730. 000眼跳距离 50. 7248. 5850. 600. 360. 701瞳孔直径 31. 5631. 8231. 910. 020. 977主任务反应时 12385. 8515444. 4415866. 4158. 580. 000主任务正确率 0. 920. 770. 55117. 440. 000次任务正确反应时变化1607. 151988. 451404. 871. 070. 346从表 1 可以看出 , 随着任务复杂性增加 , 心理努力投入和任务主观难度增大, 注视时间、注视次数、主任务反应时增加, 主任务正确率降低 , 瞳

24、孔直径变大 , 而眼跳距离和次任务正确反应时变化则没有表现出规律性的变化。方差分析结果显示, 在不同的任务复杂性条件之间, 心理努力、任务主观难度、注视时间、注视次数、主任务反应时、主任务正确率均表现出极显著的差异(p 0.05 。由此可见 , 对任务复杂性变化敏感的评估指标主要有心理努力、任务主观难度、注视时间、注视次数、主任务反应时、主任务正确率等。 3. 2 的认知负荷综合评估模型 BP 网络是一种单向传播的多层前向网络基于 BP 网络, 它能在无需事先了解输入 输出模式映射关系数学方程的情况下 , 通过对样本进行学习训练 , 建立由 n 维输入项到 m 维输出项之间的非线性映射。 BP

25、 网络由输入层、输出层和隐含层构成 , 其具体设计包括输入 /输出项设计、网络结构设计、网络训练与测试等几个方面。输出项神经元个数即所要区分和识别的认知负荷水平的等级数。在实际的作业情境中 , 认知负荷水平受任务特征、个体特征及两者交互作用的影响 , 但在某个特定的时刻或较短时间内 , 个体特征又具有相对的稳定性 , 而任务特征是决定认知负荷大小的关键因素 (Paas &van Merrienboer, 1994 。参照国外同类研究 , 本研究通过改变任务特征 (任务复杂性 来改变认知负荷水平 , 根据前述的实验设计 , 按照任务复杂性的不同将认知负荷分成 3 个1 期李金波等 :人机交互过程

26、中认知负荷的综合测评方法39等级 , 与此相对应 , BP 网络设计中输出项神经元个数设置为 3 个。输入项的确定实际上就是特征量的提取 , 对于特征量的选取 , 主要考虑它是否与认知负荷有比较确定的相关关系。由上述分析可知 , 与认知负荷显著相关的因素有心理努力、任务主观难度、注视时间、注视次数、主任务正确率和主任务反应时变化共6 个。因此 , 输入项神经元个数设置为 6 个。网络结构中的网络层数采用单隐层的三层网络 , 根据初测结果 , 隐层神经元个数选择 14 个, 隐含层传递函数采用 S 型的正切函数 , 输出层传递函数采用 S 型的对数函数 , 训练函数选择 trainl m 函数

27、(Leven 2berg - Marquardt 算法 , 期望收敛精度为 0. 001。随机选择 33 个被试中的 24 个共 72 组数据作为训练样本 , 其余的 9 个被试共 27 组数据作为测试样本。利用 MAT LAB 软件编制程序进行网络训练和测试。训练之前 , 将所有输入项进行归一化处理 , 转化成 0, 1 区间的数据 , 输出项用 0-1 二分数据形式表示。训练好的网络采用测试样本进行测试可得到测试负荷值 , 式, ( 进行比较。的绝对误差、 ( , 、相对误差绝对值和均方误差 , 求取每种负荷水平下所有被试测试负荷值与期望负荷之间绝对误差、相对误差绝对值和均方误差的均值;

28、同时计算三种负荷条件下绝对误差、相对误差绝对值和均方误差的总均值, 结果见表 2。表 2 基于 BP 网络建模的综合评估结果期望负荷值测试负荷值绝对误差相对误差 (% 均方误差10. 83-0. 1717. 200. 1521. 79-0. 2110. 400. 2232. 93 -0. 152. 300. 05绝对误差均值 =-0. 15 相对误差均值 (% =9. 97 均方误差均值 =0. 14注:表中期望负荷值 1、2、3 分别表示低、中、高三种认知负荷水平, 以下同。从表 2 可以看出 , 在不同负荷水平条件下 , 期望负荷值与测试负荷值的绝对误差、相对误差和均方误差不同。相对而言

29、, BP 网络模型在高负荷水平时其综合评估结果最为准确 (绝对误差、相对误差、均方误差均最小 。3. 3 基于自组织神经网络 (S OM 的认知负荷综合评估模型自组织特征映射网络 (S OM 是一类无教师、自组织、自学习网络 , 它能将输入项有序地映射在输出层上 , 实现将样本的高维空间在保持结构不变的条件下投影到低维空间。因此 , 可以应用于认知负荷水平的等级划分和识别研究中。S OM 网络由输入层和竞争层组成, 我们同样选择与认知负荷有显著相关的 6 个单维度评估指标作为网络的输入项。输出层的设计涉及神经元个数和神经元排列的设计两个方面。神经元个数设定为 3 个, 本研究仅对认知负荷的水平

30、进行等级划分 , 因而神经元的排列采用一维线阵来表示。训练样本与测试样本与BP 网络相同 , 经测试 , 1000次以上时 , , 3。3 绝对误差相对误差 (% 均方误差11. 100. 1010. 000. 1022. 100. 1025. 000. 5032. 80 -0. 206. 670. 20绝对误差均值 =0. 00相对误差均值 (% =13. 89 均方误差均值 =0. 27从表 3 中可以看出 , 利用构建 S OM 网络模型对认知负荷水平进行分类其相对误差要高于BP 网络模型。 3. 4基于因素分析的认知负荷综合评估模型利用因素分析可以从众多的评估指标中抽取少数几个综合指标

31、(公共因素 , 并根据特征根和因素负荷计算被试在公共因素上的得分。由于每个公共因素的方差贡献率表示该因素对总体变异的解释程度 , 反映了该因素的相对重要性 , 因而可以作为各个因素的加权系数。计算被试的因素得分的加权总和 , 这个总和值就可以作为认知负荷的综合评估指标值(王权, 李金波 , 2002 。选择上述 6 个认知负荷评估指标 , 利用主成分分析方法抽取公共因素 , 当抽取公共因素为 3 个时 , 累计方差贡献率已达 89. 86%。经方差极大正交旋转后其因素负荷矩阵见下表 4。40表 4评估指标的因素分析结果评估指标 1 V1 心理努力 V2 难度感知V3 注视时间 V4注视次数 V

32、5 主任务反应时 V6 主任务正确率 - 0. 76 0. 94 0. 95 0.09 0. 12 0. 17 3. 04 40. 09心理学报41卷公共因素 2-0.360.020.08 0. 22 0. 96 0. 83 1. 56 29. 90 3 0. 15 0. 15 0. 16 0. 95 0. 07 0. 47 0. 79 19. 87知负荷(任务复杂性 之间存在正向的相关 (系数为 0. 72,见表 6 。当任务非常容易时 , 由于个体利用 自动化知识就可以完成任务 ,因而其认知负荷低 ,投 入的心理努力少 ,绩效水平能保持在最高水平 ; 当任 务难度增大时 ,个体需要动用更多

33、的陈述性知识 ,心理努力投入增加 ,认知负荷也相应增大 ,而绩效水平 则会出现下降 。因而绩效与认知负荷 (任务复杂 性 的关系是一种负向的相关关系 , 表 6 显示认知 负荷与主任务正确率的相关系数为 - 0. 82; 而与任 务主观难度的相关为 0. 69。注视时间 、 注视次数与 认知负荷 (任务复杂性 的关系也是一种正向的相 关关系 (相关系数分别为 0. 39 和 0. 53 。这说明认 知负荷 (任务复杂性 对任务即时加工有着重要的 影响 ,认知负荷 (任务复杂性 越大 , 注视时间越长 , 注视次数越多 ,反映个体在对任务加工过程中需要 接收 、 、 编码 储存的元素数目越多 。

34、本研究的这一结 果支持 Sweller 的认知负荷理论 。本研究中 ,眼跳时间 、 瞳孔直径和次任务反应时在不同的认知负荷 (任务复杂性 水平下无显著变 化 ,这与 Paas ( 1994等人报道的瞳孔反应对认知负 荷变化具有高度敏感性的实验结果不一致。但如果 对本研究得出的不同任务复杂性下瞳孔直径的均值 作一分析 ,可以发现 , 随着认知负荷 (任务复杂性 增大 ,瞳孔直径还是表现出增大的趋势 。眼跳距离 与认知负荷 (任务复杂性 的关系存在两头高 、 中间 低的特点 ,即任务复杂性低或高时眼跳距离较大 ,任 务复杂性中等时眼跳距离较小 ; 而次任务正确反应 时变化与认知负荷 (任务复杂性

35、的关系则相反 , 呈现出两头低 、 中间高的特点 。 4. 2 单个指标测评方法与多维综合评估方法的 比较 抽取测试样本在 3 种实验条件下的各个单一评 估指标测评值 ,以及基于 3 种多维综合评估模型得 出的评估值 ,分别计算他们与相应实验条件下认知 负荷水平的 Spearman相关 ,结果见表 6。 从表 6 可见 ,各项测评结果与认知负荷水平均存在显著相关 ; 相比之下 , B P 网络评估值与认知负 荷水平的相关性最高 (相关系数为 0. 93 , 其次为 SOM 网络 ,而后是主任务正确率和因素分析评估。 由此可见 ,基于综合评估模型的评估结果与认知负 荷水平的相关总体上要高于单项评

36、估指标测评值与 认知负荷水平的相关 , 这说明采用多维综合评估模 型对认知负荷进行评估总体上比采用单一评估指标 更为有效 。而在采用单项指标的几种测评方法中 ,特征根 方差贡献率 ( %根据特征根 、 因素负荷 ,计算被试在 3 个公共因 素上的得分 ,以每个公共因素的方差贡献率作为加权系数计算 3 个公共因素得分的加权总和 。并将其 一一转化为 1, 3 区间内相应的值, 以便与期望负 荷值进行比较 ,结果见表 5。 表 5基于因素分析的综合评估结果期望负荷值 测试负荷值 1 2 3 0. 821. 79 2. 42 绝对误差 相对误差 ( % 均方误差 - 0. 18 - 0. 21 -

37、0. 58 51. 18 18. 63 19. 480. 32 0. 23 0. 47绝对误差均值 = - 0. 32 相对误差均值 ( % = 29. 76 均方误差均值 = 0.34 4讨论 4. 1评估指标对认知负荷变化的敏感性目前 ,国内外学者对认知负荷的研究大多采用 实验室实验方法 ,即通过控制任务的难度 (复杂性 来改变认知负荷水平 , 在此基础上分析各种评估指 标值随任务难度 (复杂性 改变的规律 , 进而判断各 个指标用于评定负荷状况的意义 。本研究通过改变 任务复杂性来控制认知负荷水平 , 并测量不同任务 复杂性水平下的主任务与次任务绩效 、 生理反应和主观评估指标 。以此为

38、基础 , 探讨认知负荷与各个 评估指标之间的关系 。结果显示 ,心理努力 、 任务主 观难度 、 注视时间 、 注视次数 、 主任务反应时和主任务正确率共 6 个评估指标对认知负荷的变化有显著的敏感性 。目前 ,在对心理努力与认知负荷 (任务复杂性 的关系的解释上存在两种相互矛盾的假设 , Gim ino ( 2000 认 为 两 者 之 间 是 正 向 的 线 性 关 系 , 而 Salomon ( 1983 则认为两者是 “ U形 ”倒 的曲线关 系 。本研究结果支持 Gim ino 的假设 ,心理努力与认1 期 李金波 等 : 人机交互过程中认知负荷的综合测评方法41 主任务正确率与认知

39、负荷水平的相关性最高。 表 6单个指标测评值 、 综合评估结果值与认知负荷水平值的相关心理努力 认知负荷水平: 3 p 0. 001 注 模型 B P 神经网络SOM 神经网络 0. 72 3 任务主观难度 0. 69 3 注视时间 0. 39 3 注视次数 0. 53 3 主任务反应时 0. 65 3 主任务 正确率 - 0. 82 3 BP网络 SOM 网络 因素分析 评估值 0. 81 3评估值 0. 93 3 评估值 0. 82 3 4. 3 三种综合评估模型评估结果之间的比较 负荷评估指标的敏感性会不一样 。因此 , 本研究建 立的认知负荷综合评估模型不完全适用于各类人机 系统中认知

40、负荷的测评问题 。本研究的意义在于提 供了如何构建认知负荷多维综合评估模型的方法 , 并对几种建模方法作了比较 。在实际运用这些建模 方法时 ,对于不同性质的作业 ,需要对本研究建立的 模型作出适当的修改 。 参对三种综合评估模型的评估结果进行整理 , 结 果见下表 7。 表 7 三种综合评估模型评估结果的比较绝对误差均值 相对误差均值 ( % 均方误差均值 - 0. 15 0. 00 9. 9713. 89 29. 76 0. 14 0. 27 0. 34因素分析 - 0. 32 考 文 献 由表 7 可以发现 , 在相对误差均值上 ,BP网络的相对误差最低(9.97%,其次是SOM网络(1

41、3. 89% ,两者均明显低于因素分析 ( 29. 76 % 。 在绝对误差均值上 , SOM 网络最低 , B P 网络次之 。 而在均方误差方面 , B P 网络最低 , SOM 网络次之 。 可见利用神经网络模型对认知负荷作综合评估总体 上要优于传统的因素分析方法 。神经网络通过使用 非线性映射关系来贴近复杂的非线性系统 , 摆脱了 传统的线性分析工具 ,而更适用于认知负荷的测评 。 5 结论 本研究通过分析任务特征 (任务复杂性与认 知负荷评估指标 (作业绩效 、 主观评估 、 生理指标 的关系 ,发现心理努力 、任务主观难度 、 注视时间 、 注 视次数 、 主任务反应时 、 主任务

42、正确率这 6 项指标对 认知负荷的变化具有较高的敏感性 。以这 6 项指标 的测量结果为依据 , 分别采用因素分析法 、 P 神经 B 网络和 SOM 神经网络建模技术构建认知负荷多维综合评估模型 ,发现在双任务情境下 ,采用多维综合 评估模型对认知负荷进行评估比采用单一评估指标 更为有效 。而在 3 种多维综合评估模型中 , B P 网络 和自组织神经网络 ( SOM 两种神经网络模型对认 知负荷 的 测 量 结 果 优 于 采 用 因 素分 析 法 构 建 的 模型 。本研究由视觉搜索与心算组成的双任务实验结果来分析认知负荷评估指标的敏感性, 然后基于对 搜索作业负荷变化敏感的评估指标,建

43、立起认知负 荷的多维综合评估模型 。然而 ,作业性质不同 ,认知 A h lstrom , U. , Friedm an 2berg, F. 38, 53 - 61. C hen, C. T. C h ris, B. , D aniel, L. , A lan, Y. ( 5 , 231 -244. C ooper, G. - 113. C u rrie, N. J. D ing, Y. L. , S heue, L. H. 281 - 298. G im ino, A. E. C alifo rn ia. ( 2006 . U sing eye m ovem ent activ ity as

44、 a co rrelate of cognitive w ork load. Interna tiona l J ou rna l of Industria l E rgonom ics, 36, 623 - 636. B runken, R. , P lass, J. , L eu tner, D. ( 2003 . D irect m easu rem en t of cogn itive load in m ultim edia learn ing. Educa tiona l Psycho log ist, B runken, R. , S teinbacher, S. , Plass

45、, J. ( 2002 . A ssessm en t of m em o ry tasks. Avia tion, Sp ace, and Environm enta l M ed icine, 78 m en ta l w orkload via fuzzy set app lica tions. unp ub lished D octo rial D issertation, U niversity of H ouston. Fairclough, S. H. , V enab les, L. , Tattersall, A. m en ta l effo rt in academ ic

46、 tasks: a va lida tion and exp lo ra to ry study . unp ub lished D octorial D issertation, U n iversity of Sou thern cogn itive load in m ultim edia learn ing using dual2task m ethodology. Exp erim enta l P sychology, 49 ( 1 , 109 - 297. ( 2006 . C ognitive p rocessing du ring w eb sea rch: the role

47、 of w orking m em o ry load in selective a tten tion and inh ib ito ry con trol unpub lished D octorial D issertation, Ind iana U niversity. . ( 2007 . EEG co rrelates of task engagem en t and m en tal w o rk load in v igilance, learn ing, and ( 1997 . The developm ent of a comp osite index of ( 199

48、9 . U se of neu ral netw o rks to achieve dynam ic task allocation: a flex ib le m anufactu ring system exam p le. Interna tiona l J ou rna l of Industria l E rgonom ics, 24 ( 2 , ( 2005 . The influence of task dem and and learn ing on the psychop hysiological resp onse. Interna tiona l J ou rna l o

49、f P sychology, 56, 171 - 184. ( 1990 . C ogn itive load theo ry as an aid for instructional design. Austra lian J ou rna l of Educa tiona l Technology, 6 ( 1 , 108 ( 2000 . F acto rs tha t influence studen ts investm en t of42 G rootjen, M. , N eerincx, M. A. , V eltm an, J. A. 心理 学报 ( 2006 . Pau l,

50、 A. 41 卷 ( 2006 . U sing sub jective m easu res to detect variations of Cognitive task load in a naval sh ip con trol centre: from identification to p red iction. E rgonom ics, 49 ( 12 , 1238 - 1264. Kalyuga, S. , C handler, P. , Sw eller, J. ( 1999 . M anag ing sp lit2 in trinsic cognitive load w i

51、thin p roblem s. L ea rn ing & Instruction, 16 ( 5 , 389 - 400. R eed, W. M. , B u rton, J. K. , Kelly, P. ( 1985 . The effects of atten tion and redundancy in m ultim edia instruction. App lied C ognitive P sycho logy, 13, 351 -371. K ilseop, R. , M yung, R. w riting ab ility and m ode of d iscou r

52、se on cognitive cap acity engagem en t Resea rch in the Teaching of Eng lish, 19, 283 - 297. . R oger, W. S. ,R obecca, L. G. , G o ry, B. R. ( 2003 . M odel of ( 2005 . Evalution of m en tal w o rk load w ith a com b ined m easure based on p hysio log ical ind ices du ring a M ental W o rk load. In

53、 terna tiona l J ou rna l of Industria l E rgonom ics, 28 ( 2 , 381 - 407. Salom on, G. ( 1983 . The d ifferen tial investm en t of m en tal effo rt in dual task of tracking and m en tal arithm etic. Interna tiona l J ou rna l of Industria l E rgonom ics, 35, 991 - 1009. L aine, T. I , B auer, K. W.

54、 , J r Teffrey, W. . ( 2002 . S election of learn ing from differen t sources. Educa tiona l P sychologist, 18 ( 1 , 42 - 50. Shayne, L. , Penelope, S. , A ndrew , N. ( 2007 . M odeling and inpu t featu res across subjects for classify ing crewm em ber w o rk load using artificial neural netw o rks.

55、 IEEE Transactions on System s, M an, and cybernen tics 2 a rt A: System s and H um ans, 32 ( 6 , 691 p - 704. m odel fo r m en tal w o rk load classfication. IEEE Transactions on N ew York: W iley Press. System s, M an, and cybernentics 2 rt A: System s and H um ans, 31 pa ( 6 , 1822 - 1825. ( 1976

56、 . B ehavio ra l founda tions of system developm ent . ( 1956 . The m ag ical num ber seven, p lus o r m inus tw o: som e lim its on ou r capacity fo r p rocessing info rm ation. P sycho log ica l Review, 63, 81 - 97. ( 2005 . Im p rov ing 32, 2713 - 2730. ( 1993 . The efficiency of perform ance m e

57、asu res. H um an F acto rs, 35, 737 - 743. ( 1994 . Instructional con tro l of cogn itive load in the train ing of com p lex cogn itive tasks.Educa tiona l P sycho logy Review, 6 ( 4 , 351 - 371. p ilo t m en tal w o rk load classification th rough featu re exp lo itation and com b ination: a feasib

58、 ility study. Comp uter &O p era tions Resea rch, instructional cond itions: A n app roach to com b ine m en tal effo rt and ( 2001 . Self 2 rgan izing M ap ( SOM O Predicting M en tal W o rk load in En R ou te A ir T raffic C ontro l: C ritical R ev iew and B roader Im p lications.H um an F acto rs

59、, 49 ( 3 , 376 - 399. Shayeghi, H. , Shayanfar, H. A. ( 2006 . A pplication of ANN technique based on 2synthesis to load frequency con trol of in terconnected p ow er system. In terna tiona l J ou rna l of E lectrica l Pow er & Energy System s, 28 ( 7 , 503 - 511. Tabbers, H. , M artens, R. L. , van

60、 M errienboer, J. ( 2004 . M azaeva, N. , N tuen, C. M eister, D. M iller, G. A. M ultim edia in structions and cogn itive load theo rys : Effects of m odality and chang. B ritian J ourna l of Educa tiona l Psycho logy, 74, 71 - 81. Tuovinen, J. , Paas, F. ( 2004 . Exp lo ring m ultidim ensional N oel, J. B. , B auer, K. W. , L ann ing, J. W. app roaches to the efficiency of instructional conditions. Instructiona l Science, 32, 133 - 152. W aard, D. ( 1996 . The m easurem ent

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!