呼唤课程测量与评价的专业化

上传人:lis****210 文档编号:125648701 上传时间:2022-07-27 格式:DOCX 页数:5 大小:13.84KB
收藏 版权申诉 举报 下载
呼唤课程测量与评价的专业化_第1页
第1页 / 共5页
呼唤课程测量与评价的专业化_第2页
第2页 / 共5页
呼唤课程测量与评价的专业化_第3页
第3页 / 共5页
资源描述:

《呼唤课程测量与评价的专业化》由会员分享,可在线阅读,更多相关《呼唤课程测量与评价的专业化(5页珍藏版)》请在装配图网上搜索。

1、呼唤课程测量与评价的专业化“课程评价国际研讨会”综述杨向东王中男作者简介:杨向东/华东师范大学课程与教学研究所副教授(上海200062) 王中男/华东师范大学课程与教学研究所博士生(上海200062)2009年11月6日8日,“课程评价改革国际探讨会”在华东师范大学召开。 此次研讨会由华东师范大学课程与教学研究所举办,5位来自美国、澳大利亚、 荷兰的国际知名测量与评价领域的专家,与200多位我国课程测量与评价的专家、 学者及与会代表一起,围绕“促进课程评价的专业化”主题,通过大会学术报告、 分会场专题报告、现场对话等方式,着重探讨了 “高考、中考专业化的体制与机 制;学生学业质量监测;考试命题

2、与测验编制;旨在改进的课堂教学评价;发展 性课堂学习评价”等我国当前测评研究与实践中面临的重要议题。一、我国课程测量与评价领域当前存在的问题就在此次课程评价国际研讨会召开前夕,教育部陈小娅副部长在全国基础教 育课程改革经验交流会上就明确指出,“下一步将深化考试评价制度改革,充分 发挥推动素质教育的导向作用”。参加此次“课程评价改革国际探讨会”的与会 专家和代表们对此深表认同。因此,此次课程评价研讨会的一个重要议题是重新 反省我国新课程改革进程中课程评价的理论和实践,充分认识当前课程测量和评 价领域中所面临的挑战和存在的问题。经过近三天的研讨、对话和分析,与会者 就以下几个问题达成共识。首先,我

3、国当前课程测量与评价领域及其相关领域的研展相对薄弱,无法回 应新课程推进过程中所提出的众多理论和实践问题。新课程作为我国基础教育发 展历程中史无前例的改革,在课程理念、目标、内容、实施、评价与管理等方面 提出了诸多先进的、前瞻性的思考。然而,如何在课程设计、教材编写、教学实 践中贯彻这些理念?如何科学有效地开展相应的测量和评价?这一系列问题都有 待深人系统的研究。评价理念的滞后以及评价研究的薄弱,使得课程测量与评价 逐渐凸现为新课程推进过程中的瓶颈,成为制约实施素质教育的重要因素。例如, 新课程倡导建构学习,强调学习过程是学生主动探究的过程,质疑、思考、体验 生活世界和科学世界的过程。相应地,

4、课程评价应该减少对传统评价模式的依赖, 降低对学生学科内容知识和基本技能的考察,转而寻求对学生灵活运用学科知识 去理解、探究世界,并在理解基础上提出问题、解决问题的能力的评价。这就要 求我们充分了解建构学习是如何产生和发展的,基于学科知识结构形成的问题解 决能力是如何形成和培养的。诸如此类的问题,都对课程测量和评价的科学性和 合理性有着至关重要的影响。此外,作为一种评价方式,“听评课”在我国课堂 教学评价中占据着稳固地位。然而,华东师范大学课程与教学研究所所长崔允都 教授在研究中发现,当前我国听评课从专业化的视角来看存在着“三无”现象一 一听课无合作、评课无证据、听评课无研究。所谓无合作,是指

5、听评课的人和上 课的人,以及听评课的人之间往往没有分工、不合而作,把本来应该是合作的专 业实践,当作了个人的事务。无证据主要是指听评课的人在谈论意见的时候,更 多的是根据自己的感觉,“我觉得应该怎么上”,而不是基于证据进行推论。无 研究是指许多人都把听评课看作是一项管理制度,而不是一项专业活动一一教师 间合作研究课堂教学的专业活动。其次,作为课程测量与评价的核心成分,我国当前教育考试的测量学水平亟 待提高。这里的教育考试,包括了从中考、高考,到各种学习质量监控考试,再 到各种课堂学习评价等学业成就考试。虽然在整体的设计思路上我国教育考试目 前的实践与国际上同类测验相似,但在具体环节的实施上还有

6、很大差距,直接影 响到测验目的的达成和测验结果的质量。华东师范大学课程与教学研究所副教授 杨向东博士认为,这种差距主要体现在测验编制过程中对测量学问题的思考不 足,对相关测量学技术的应用程度不够。例如,我国目前现有的课程标准过于概 括抽象,只规定了最后的目标,缺乏描述各年龄阶段学生实际表现程度的水平标 准,直接影响到教育考试框架的制定水平和质量保障。在测验题目开发方面,我 们更多的依赖命题专家的经验和判断,较少严格遵循详尽系统的测量学规范和步 骤。我们较少组织测验题目的预测,并根据学生实际回答的数据进行测量学方面 的分析,检验题目选项是否符合了预期功能、是否测量了应该测量的东西、是否 对不同性

7、别或地区的学生是公平的等等。这种经验式的命题和组卷模式直接影响 到最终测验的稳定性和准确性,降低了对学生学习情况进行推断的有效性。第三,我国教育考试多以教育行政部门为主导,缺乏独立的专业性的考试研 发机构。我国教育考试的行政化色彩使得当前的学生学业评价客观上过分强调了 考试评价如何为教育管理和决策服务,而忽视了如何为学生学习和教师教学服 务;客观上强调了考试的选拔功能,而忽视了对学生学习的发展性功能。与会专 家指出,行政的手段有时会直接干预到对学业成就考试的技术要求,如考试的分 值、题型、题量、难度、等第划分方式等等,从而使得教育测验的设计开发无法 按照科学、正确的程序进行。因此,课程测量和评

8、价的健康发展呼吁独立的考试 研发机构的诞生。此外,专业性的考试研发机构的成立还有助于我国大规模考试 专业化水平的提高。大规模考试的设计、开发、实施和分析是一项复杂的系统工 程,涉及到课程、学科、测量学、心理学以及计算机技术等方面,需要不同背景 的专业人士组成研发团队,团结协作,紧密配合,在不同的层面上组成梯队。从 这种意义上讲,专业性的考试研发机构是组织相关力量,构建考试研发团队的理 想平台。第四,考试开发和教育实践队伍的教育测量和评价素养有待提高。在我国, 中高考等总结性测验的设计开发通常是由教育考试机构组织学科专家进行命题 和组卷。学科专家具有的更多的是学科本身的知识,通常缺乏心理与教育测

9、量方 面的知识来理解测验所要考察的心理属性,更缺乏相应测量技术和方法来验证测 验题目的质量。外部评价如此,与实际教学密切结合的课堂评价更是如此。我国 一线教师通常很少受过系统的心理或教育测量理论和技术方面的训练,课堂评价 任务的设计或选择往往参照外部考试的题目样例或模式,较少从当前课程内容和 学习目标的实际出发。上海教育考试院雷新勇副院长指出,造成这种现象的根本 问题在于高校在心理与教育测量方面的教育水平偏低。我国很少有高校开设教育 和心理测量专业的课程,即使有些教育管理、师范类学生接受了教育评价课程教 育,也多数是重书本、轻实践,重理论、轻技术。这是长期以来我国教育考试事 业落后,问题迟迟得

10、不到解决的深层次原因。二、我国课程测量与评价迈向专业化的建议与方向除了研讨我国当前所面临的挑战和存在的问题,与会专家还从各种角度提出 了我国课程测量和评价领域迈向专业化的种种建议,指明进一步发展的方向。来 自美国著名的教育测量公司ACT的题目开发和测验编制部门的资深测量专家高晓 虹博士向与会人员详细介绍了 ACT大规模考试的题目设计和测验开发过程。她指 出,题目设计和测验编制是一个非常复杂的、多周期的过程,是一种艺术与科学 相结合的过程。命题专家的创造性和经验体现在题目设计中,而测量学的理论和 技术则从科学上保证题目的质量。给与会专家和学者留下深刻印象的是,在ACT 的大规模考试中,一道题目从

11、设计伊始到最终进入考试试卷,需要经历至少16 道程序的检测,历时2到3年。这其中既有包括学科专家、测量学专家在内的题目 评审小组的审核,也有基于预测数据的测量学分析。题目质量的评审涉及到内容、 认知、题型、反应时间、公平性以及常见的难度和区分度等测量学指标。这种严 格遵循详尽系统的测量学规范和步骤的测验开发过程无疑对我国教育考试的专 业化有着深刻的借鉴意义。美国著名测量公司CTB/McGraw Hill首席研究专家,前国际心理测量学会主 席wim Vander Linden介绍了当前国际上有关题库建设的理论和技术的最新进展, 并演示了根据题库进行自动化组卷的基本原理与具体技术。他指出,随着计算

12、机 技术的不断普及以及现代测量理论的迅猛发展,构建大型的教育测量和考试的题 库已成为可能。例如,他所在的CTB / McGraw Hill目前已经开发了一个容纳有 70000个题目的大型题库,包括了美国中小学阶段的各个学科的内容。利用现代 测量理论,如项目反应理论,既可以保证纳人题库中的测验题目的测量学指标, 还可以确保不同测验题目在共同的测量尺度上测量相同的心理或教育属性,从而 保证了从题库中生成的各种测验在测量属性上的同质性。大型题库的存在是自动 化组卷技术的物质前提。自动化组卷可以在几秒之内完成几十、甚至几百套试卷 的组卷任务,并能严格保证每套试卷满足多达上百种的技术要求,或者保证不同

13、试卷问的一致性,为我国大规模考试提供了很好的借鉴。目前,国际上所提倡的 连续性评价的做法就是建立在计算机化的题库建设和自动化组卷技术基础之上 的。大型题库的建设还是计算机适应性测验的基础。美国伊利诺伊大学香槟分校 教育测量学教授,美国国家教育进步评估(American NationalAssessment of Eucation Progress; NAEP)设计开发与技术分析专家张华华是当前国际上著名的 计算机适应性测验专家。他指出,计算机适应性测验以项目反应理论为依据,根 据学生对已经呈现的问题的回答情况动态调整后继测验题目的呈现,避免了传统 纸笔测验中因题目过难或过易而导致的测量效率的降

14、低。采用计算机适应性测验 具有高效、准确、计分迅速和反馈及时等多种优点,因此,他建议我国教育考试 和评价多采用计算机化的测验模式。他还指出,计算机化测验还可以与当前国际 上流行的认知诊断测验相结合,利用测量学技术从学生回答问题的反应模式中挖 掘深层信息,为教育实际工作者提供具有诊断性的反馈信息。在考试结果的分析和汇报方面,澳大利亚教育研究.委员会(Australia Coundl of Educational Research; ACER)的首席执行官,前墨尔本大学教授Geoff Masters以PISA为例,向与会人员介绍了如何通过运用现代测量理论建立测验分 数的测量尺度(Scale)以及不

15、同分数的实质含义,使教育考试的分数具有像长度 或重量那样的特征,从而使对考试结果的解释不依赖于某个具体的测验,能够在 同个尺度上对不同学生个体和集体进行描述和比较。他指出,共同测量尺度的建 立提供了描述和追踪学生学习和发展变化的基础和可能。与国外专家一样,与会的国内专家学者们分别从不同的角度分析论证了我国 课程测量和评价走向专业化的可能和路径。专家们从我国考试制度和体制的改 革、课程标准的制定、评价形式的转变、测量技术的提升和应用等等方面介绍了 各自的理论构想和研究成果。例如,众多的与会学者探讨了在现有形式下如何改 革我国的中高考制度和体制,探索了以高考、学业水平考试和综合素质考试“三 位一体

16、”的评价体系。在改革教育考试开发与教育行政部门关系上,与会专家指 出教育行政机构应该“从政策层面确定学业水平考试的目标和要求,而学业水平 考试的设计、开发、管理等专业问题,应该交由专业的考试机构独立地进行”。 在课程标准的制定上,上海教育考试院雷新勇副院长认为,我国的课程标准更接 近于西方课程标准和内容标准的融合,而缺乏学业标准或表现标准的成分。他指 出,“教育部已经下文要求各省市建立与新课程改革相配套的学业水平标准”。这就为我国学业水平考试提供了科学发展的前提条件。在评价形式的转变方面, 众多的与会学者分别从关注过程的动态评价、关注“真实任务”的表现性评价以 及关注信息技术的形成性评价等角度

17、进行了探讨。值得一提的是,此次研讨会还出现了从认知心理学的角度对教育考试中测验 题目所涉及的认知因素的研究,如华东师范大学心理学院邵志芳副教授对中高考 试题的认知任务分析,以及上海教育考试院的贾林芝和雷新勇等人对高考题目的 认知要素与测量目标关系的研究。由于我国教育考试效度的研究历来非常薄弱, 这些研究的出现提供了分析考试效度的一个新途径。此外,许志勇等基于认知诊 断测量模型对数学测验进行设计和分析的研究,也在一定程度上反映了我国在测 量理论和技术方面与国际测量学研究的接轨。三、我国课程测量和评价领域发展的进一步思考三天的课程评价改革国际研讨会取得了圆满成功,然而中国的课程测量和评 价领域的发

18、展依然任重而道远。应该看到,无论是理论研究还是实践层面,我国 在课程测量和评价领域的发展与国际先进水平还相去甚远。中国的课程测量和评 价领域能否发展壮大,能否承载当前课程改革所提出的种种理论和实践问题,有 待于几方面的协调发展。首先,加强课程测量、评价及其相关领域的学科建设, 壮大学科队伍,提高科研水平。这里科研水平的提高,并不单纯是指我国在测量 理论研究和技术开发上与国际接轨的问题。能够发表国际领先的研究成果固然重 要,然而,能否对我国基础教育改革目前面临的重大理论和现实问题展开研究, 解决当前课程改革进程中的实际问题有着更为现实的意义。其次,通过专业协会 的引领或者政府相关部门的支持,加强

19、与课程测量评价相关问题的跨学科的协作 与交流。从新课程的理念到一线的教学改革,我们国家目前缺乏一个系统的、分 层次的学术研究梯队,对如何从哲学化的课程理念转化成科学有效的教学实践展 开不同角度和层次的科学研究。这其中,测量和评价有着重要的地位,但同时还 要考虑到课程、学科、心理学等诸多方面研究的作用。第三,提高我国课程测量 和评价理论和技术的教育水平,提升教育理论和实践人员的测量与评价素养。只 有当测量学原则成为每个教育人员开发教育测验或进行课程评价时自觉的执行 原则,只有当每个一线的教育工作者具备了必要的测量和评价素养,我们或许能 够讲,我国课程测量和评价已经迈向专业化。至少就目前而言,尚有众多的工作 等待我们去做。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!