网易首页 > 网易号 > 正文 申请入驻

数字教育理事会发布AI重塑评估报告

0
分享至


2025年7月7日,数字教育理事会(Digital Education Council,成立于2024年,是一个由100多家机构组成的全球实践共同体,致力于推动高等教育和劳动力发展领域的可持续创新和AI应用,总部位于新加坡)与培生集团(Pearson)联合发布《评估的新时代:AI在评估设计中的全球综述》(The Next Era of Assessment:A Global Review of AI in Assessment Design),首次全面梳理了全球教育工作者如何利用AI重塑评估体系。报告聚焦高等教育领域,具体从AI对评估各环节的影响、AI时代的评估体系重构及实践指南等方面进行了分析。

一、AI对评估各个环节的影响

评估一般包括设定学习目标(Set Learning Outcomes)、规划课程(Plan Curriculum)、制定评估(Develop Assessments)、评估实施(Assessment Delivery)、反馈与改进(Feedback and Review)5个环节。该报告从AI可对各个环节带来哪些可能性和针对AI需做出哪些调整两个维度进行了分析。


1.AI对设定学习目标环节的影响

可能性——通过分析劳动力市场数据等大规模数据集,识别技能缺口并制定与时俱进的学习目标;自动化常规任务使学生能专注于高阶认知活动,推动评估向批判性和复杂技能发展。

必要调整——评估需纳入AI相关能力指标,如AI输出评估、负责任使用AI等;明确区分需独立掌握的技能和可通过AI强化的技能。

2.AI对规划课程环节的影响

可能性——基于预期学习成果自动生成课程体系建议;根据学生画像提供个性化学习路径设计。

必要调整——划课程时需明确AI工具的使用规范;增设AI工具使用相关的伦理教育内容;平衡人类核心能力与AI技能的培养。

3.AI对制定评估环节的影响

可能性——自动生成测验题、案例分析和评分标准;作为写作辅助工具或模拟器参与评估设计;通过模拟真实场景提升评估真实性。

必要调整——重构评估形式以减少对AI的依赖;从结果导向转向过程评估;更新评分标准以鼓励原创性和批判性思维。

4.AI对评估实施环节的影响

可能性——实时反馈指导学生改进;自动化监考功能;通过AI角色扮演增强情景化评估。

必要调整——明确每项评估的AI使用规则;增加现场考核环节确保评估真实性;记录学生完成任务的过程性证据。

5.AI对反馈与改进环节的影响

可能性——协助评分并提供个性化反馈;对评估数据进行大规模分析以辅助改进;生成课堂表现概要并提出改进评估建议。

必要调整——建立定期评估更新机制,确保评估工具始终有效抵御AI演进带来的挑战。

二、重新思考AI时代的评估

报告认为,AI时代评估设计需要从多个层面进行审慎考量——从单项任务到贯穿整个课程的评估组合。这一重构过程主要围绕三个关键维度展开:评估类型、评估设计原则和评估组合。

1.评估类型:在完成单项评估任务时,人工智能应扮演何种角色?

根据具体学习目标和AI使用对目标实现的影响程度,确定评估应采用"AI禁用型"(AI-Free Assessment)、"AI辅助型"(AI-Assisted Assessment)还是"AI融合型"(AI-Integrated Assessment)模式(见表1)。

表1 AI评估分类

类型

使用场景

核心特征

AI禁用型评估

专门设计为无需AI协助完成的评估

评估的目标、能力和设计本身有意排除或减少对AI的运用,而侧重于学生独立思考的能力以及基础技能的培养

AI辅助型评估

在明确边界内允许使用AI完成特定任务(如头脑风暴、大纲拟定)

评估的目标、能力和结构允许AI作为一种支持工具发挥作用,鼓励使用基本的AI来提供帮助或反馈,同时确保学生主导的学习仍占据主导地位

AI融合型评估

将AI工具作为学习和评估体验的有机组成部分

评估的目标、能力和提示要求学生有意义的参与AI作为核心部分的任务,包括在其学科领域内应用、批判和反思AI

2.评估设计原则:如何确保所有评估在AI存在的情况下仍保持效度和信度?

抗AI干扰性(AI-Resilient)原则正逐渐成为保障各类评估有效性与完整性的关键设计原则。这种抗干扰性设计并非依赖学生的自觉遵守,而是通过精心构建条件与框架,使学生难以借助AI完成核心学习任务,从而确保核心学习成果不会被轻易外包给AI。实现抗AI干扰性不仅需要更新规则或技术,更需要对评估体系进行结构性重构。教育工作者可采用多种创新策略重构评估方式以实现这一目标(见表2)。

表2 重构评估以实现抗AI干扰性的策略

策略

描述

示例

课堂上保持人类核心任务

将评估拆分为多个部分——允许AI承担课外可执行的任务,但需将批判性思维、讨论和阐释环节保留在结构化且有监督的教学环境中

学生在家中使用AI进行头脑风暴并起草方案,但在课堂上需现场陈述论点并即时回应提问

将关注点从“输出”转向“过程”

评估导致最终结果的推理、规划和决策过程,而不仅仅是结果本身。鼓励元认知层面的参与。

学生在最终提交的作品中需记录并反思影响其工作的AI交互过程,或对解决方案提供合理性说明

嵌入检查点与可追溯发展

引入结构化里程碑,例如中期提交、现场讨论、反馈循环或规划工件,以展示学生的渐进式思维

在课堂上组织同伴讨论与反馈环节,并要求学生根据反馈意见修改作业

单元层面而非任务层面的效度验证

需认识到并非所有评估方式都能完全规避人工智能的影响。相反,应通过单元或课程中一系列相互关联的评估来验证学生的学习成效。其中每项评估都基于学生先前的作业成果,并以贴合其学习情境的方式递进构建。

学生在四节课中逐步完成最终作品——从概念构思开始,到最终的互动展示结束。

每个阶段都要求学生基于前期成果完成不同的任务。有效性体现在四节课之间的连贯性与递进性,而非单一任务的表现。

3.评估组合:如何组合不同类型的评估,以同时培养基础能力和面向未来的AI技能?

在课程层面,教师应确保其评估体系能同时支持人类核心能力(基础知识、批判性思维、学科专业知识以及独立技能)与AI相关技能(有效且合乎道德地使用AI工具的能力、支持反映未来职场需求的形成性与真实性评估)的培养。


基于已有研究,数字教育委员会提出“双优先级方法”,旨在帮助教师有意识地在各类评估中平衡这两个互补目标。三种评估类型可在这两个优先级框架下发挥不同作用(见表3)。

表3 支持类型总结

评估类型

优先级1:人类能力

优先级2:人机协作

AI禁用型评估

主要关注点

不适用

AI辅助型评估

关键关注点

培养基础AI技能

AI融合型评估

需精心设计以支持人类能力培养

关键关注点

教师不应孤立地设计评估方式,而应有意识地规划和多样化评估手段,以便在整个课程中兼顾这两个优先级。

三、AI时代评估设计指南

该报告针对三类评估均提出了具体的实践建议,并重点介绍了AI融合型评估的实践路径。

1.AI禁用型评估

报告指出,在设计旨在培养或测试学生独立思考和基础技能的评估时(AI禁用型评估),关键在于从结构上消除使用AI的可能性,而非仅发布“禁用AI”的规定并寄希望于学生自觉遵守。解决方案在于构建具有内在抗AI干扰性的评估体系。其中最有效方法是将异步评估转为同步评估,从根本上阻断学生在完成任务时接触AI的途径。监考测试、口试、课堂写作研讨会、实时演讲或课堂讨论等形式在结构上天然具备抵御AI干扰的特性。这些同步评估模式并非通过监控手段,而是通过消除使用机会来降低AI滥用的可能性。

然而,要求所有作业都采用这种形式并不现实,尤其是那些支持持续性形成性学习的评估,为此,教师还可以通过设计能利用AI当前缺陷的任务,使得AI难以或无法代学生完成任务。具体策略包括:

情境化应用任务——要求学生将知识或技能应用于本地情境、时事热点或近期课堂讨论,这些背景信息通常超出AI的获取与解读能力范围。

过程性文档记录——要求学生提交思维过程的实证材料,如带批注的草稿、规划笔记或语音备忘录,以展示其观点随时间演进的轨迹。

2.AI辅助型评估

报告指出,在允许学生将AI应用于评估时,教育者必须审慎考量其适用场景与限制边界,以确保AI技术能有效支持——而非削弱——既定教学目标。

AI可参与评估流程的多个环节。报告给出了以下使用导图(见表4),系统梳理了学生在作业中可能接触AI的关键节点。

教师可参照此导图,将AI应用与具体学习目标精准对接,明确划定允许使用、限制使用或需提供明确指导的领域。对于需要限制AI使用的评估环节,教师应着力重构这些评估要素以增强其“抗AI干扰性”,而非单纯依赖学生的自律遵守。

表4 AI使用导图

阶段

关键AI接触点

规划阶段

头脑风暴/框架建议/时间规划

研究阶段

关键词推荐/文献检索/文献综述/术语解释/提出论点或观点/方法设计

创作阶段

大纲生成/初稿撰写/生成部门内容/图表制作/内容整合

修改阶段

语句润色/语法检查/反论证模拟/修正参考列表/缩短或延长/错误修正

反馈与反思阶段

生成评价/促进反思/对照评分标准

3.AI融合型评估

报告指出,AI通过引入评估学习进程的新方法、增强与现实场景的关联性以及赋能AI相关能力的发展,为革新测评实践展现出巨大潜力。

基于101个全球案例研究,报告将AI融合型评估进一步总结为两种主要方法:一是利用AI技术提升传统评估方式,即利用AI辅助核心学科学习;二是将AI作为研究对象,重点培养学生的AI素养。围绕这两种方法,报告归纳出14种新兴的AI融合型评估设计方法,并将其与特定的学习目标和AI能力(例如提示词设计、AI输出评估和AI伦理)进行了对应分析(见下表5和6),并给出了每一种方法的具体实践案例。

表5 用于增强传统评估的新兴AI融合设计方法

方法论

描述

最适合达成的学习成果

最适合培养的AI能力

01 AI引导的自我评估与反思

学生与AI工具进行结构化对话,以测试、解释或评估自己对某个概念或论点的理解。

•自我反思

•输入设计与信息质量

•概念理解

•AI反思与元认知

02 AI先行,人工修订

学生首先使用生成式AI工具生成初稿或解决方案,然后对其进行评估、修订和扩展。

•文本/文学分析

•AI输出评估

•过程改进与评估

•AI偏见与限制意识

03 人工先行,AI评审

学生先独立完成任务,然后使用生成式AI工具来评审和改进自己的作品。

•过程改进与评估

•AI反思与元认知

•概念理解

•AI输出评估

04 AI生成分析材料

AI生成样本材料(如案例、解决方案),学生随后运用学科方法对其进行分析、解读或解决。

•定量/数据分析

•AI输出评估

•概念理解

•AI偏见与限制意识

05 AI作为模拟协作者或角色扮演者

学生与模拟某个角色、专家或真实人物的AI进行互动。

•沟通

•AI输出评估

•自我反思

•AI整合与应用

06 用于沉浸式学习的AI

学生使用生成式AI工具创造丰富的体验,以加深对学科概念的理解。

•概念理解

•AI整合与应用

•创造力与创新

•输入设计与信息质量

07 人工与AI工作成果比较

学生对同一项任务中人工完成和AI生成的结果进行分析和比较。

•过程改进与评估

•AI输出评估

•自我反思

•AI偏见与限制意识

08 AI作为助手

学生在任务的一个或多个阶段将AI工具作为协作者使用。

•沟通

•AI整合与应用

•研究与调查

•输入设计与信息质量

表6. 以AI为主要研究对象的新兴AI融合设计方法

方法论

描述

最适合达成的学习成果

最适合培养的AI能力

01 AI输出批判与评估

学生批判性地评估AI生成内容的质量、准确性或偏见。

•自我反思

•概念理解

•AI输出评估

•AI反思与元认知

02 提示词工程与过程分析

学生尝试设计AI提示词,并反思输入设计如何影响输出结果。

•概念理解

•协作与团队合作

•AI输出评估

•输入设计与信息质量

03 AI伦理、政策与社会影响

学生通过辩论、反思或政策设计,探讨AI的伦理、法律和社会影响。

•自我反思

•伦理与责任

•AI反思与元认知

•AI伦理与负责任使用

04 建设性误用

学生有意地“误用”AI至其极限,以揭示其缺陷或偏见。

•概念理解

•伦理与责任

•AI输出评估

•AI伦理与负责任使用

05 AI作为情境化案例研究

AI被用作一个透镜,来探索特定学科领域内的概念。

•自我反思

•概念理解

•AI伦理与负责任使用

•AI反思与元认知

06 AI作为人造产物

学生设计或定制自己的AI工具。

•过程改进与评估

•实际应用

•AI整合与应用

•AI伦理与负责任使用

资料来源:

Digital Education Council. The Next Era of Assessment: A Global Review of AI in Assessment Design. https://www.digitaleducationcouncil.com/post/the-next-era-of-assessment-a-global-review-of-ai-in-assessment-design

[本文为教育部国别和区域研究基地中国教育科学研究院国际教育研究中心成果]


本文由中国教育科学研究院“教育国际前沿”课题组整理,课题组负责人张永军,编辑刘强。点击左下角阅读原文可下载该文献。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
独生子女家庭一定要立遗嘱,而且遗嘱里一定要“加上这3句话”

独生子女家庭一定要立遗嘱,而且遗嘱里一定要“加上这3句话”

娱乐圈见解说
2026-02-26 19:40:20
重大进展!伊朗作出“前所未有”承诺:同意永远不拥有可制造核武器的核材料,将实现“零积累、零库存”,并接受全面核查!特朗普最新表态

重大进展!伊朗作出“前所未有”承诺:同意永远不拥有可制造核武器的核材料,将实现“零积累、零库存”,并接受全面核查!特朗普最新表态

每日经济新闻
2026-02-28 10:40:45
巴媒:安切洛蒂敲定世界杯名单18人,不含内马尔、恩德里克

巴媒:安切洛蒂敲定世界杯名单18人,不含内马尔、恩德里克

懂球帝
2026-02-28 08:41:06
震惊!网传广西某设计院普通员工年终奖144000元,月工资86699元

震惊!网传广西某设计院普通员工年终奖144000元,月工资86699元

火山詩话
2026-02-27 12:08:36
火爆冲突!多尔特绊倒约基奇二级恶犯被驱逐 约基奇推搡杰林均吃T

火爆冲突!多尔特绊倒约基奇二级恶犯被驱逐 约基奇推搡杰林均吃T

醉卧浮生
2026-02-28 12:59:52
2月27日俄乌最新:俄罗斯又反手给了某人一记耳光

2月27日俄乌最新:俄罗斯又反手给了某人一记耳光

西楼饮月
2026-02-27 17:30:19
儿子3年前来杭州当暑假工跑外卖,租电动车3年没还欠下2万多元!爸爸急了:平台一直自动续租,如何解决?

儿子3年前来杭州当暑假工跑外卖,租电动车3年没还欠下2万多元!爸爸急了:平台一直自动续租,如何解决?

都市快报橙柿互动
2026-02-28 09:28:18
中国四位最“不靠谱”专家,“忽悠”央视28年,为何还能爆火至今

中国四位最“不靠谱”专家,“忽悠”央视28年,为何还能爆火至今

小莜读史
2026-02-27 20:30:12
四川成都一交警在马路中央被非机动车撞飞,头部流血送医;警方回应:被撞交警正在医院治疗,事故原因正在调查中

四川成都一交警在马路中央被非机动车撞飞,头部流血送医;警方回应:被撞交警正在医院治疗,事故原因正在调查中

扬子晚报
2026-02-27 15:37:20
到了美国终于敢说实话:中美之间藏在骨子里的差距,真的很扎心!

到了美国终于敢说实话:中美之间藏在骨子里的差距,真的很扎心!

天下霸奇
2026-02-27 08:51:57
阿富汗被巴基斯坦暴捶:塔利班军事依旧简陋,财政多用于宗教建设

阿富汗被巴基斯坦暴捶:塔利班军事依旧简陋,财政多用于宗教建设

黄娜老师
2026-02-27 22:32:30
女孩被打后续:村民发声,打人夫妻更多信息被扒,最高可判10年

女孩被打后续:村民发声,打人夫妻更多信息被扒,最高可判10年

天天热点见闻
2026-02-27 07:01:26
人民币汇率三日急涨600点,央行出手

人民币汇率三日急涨600点,央行出手

21世纪经济报道
2026-02-27 20:45:30
林孝埈韩国教练冬奥会前被国家队解雇!韩媒:因为抗议刘少昂犯规

林孝埈韩国教练冬奥会前被国家队解雇!韩媒:因为抗议刘少昂犯规

念洲
2026-02-28 09:36:30
一年8亿兜底50万从业者…中国企业家把钱花在了出乎意料的地方

一年8亿兜底50万从业者…中国企业家把钱花在了出乎意料的地方

智谷趋势
2026-02-26 20:43:32
俄罗斯驻华大使馆微博,27日深夜发文称:中国网友误会我们了!

俄罗斯驻华大使馆微博,27日深夜发文称:中国网友误会我们了!

消失的电波
2026-02-28 08:43:31
疑似王一博被爆私密聊天记录,鹿晗肖战躺枪,工作室成已取证

疑似王一博被爆私密聊天记录,鹿晗肖战躺枪,工作室成已取证

娱文速递
2026-02-28 10:24:07
网传新能源汽车开征“里程税” 收费0.12元/公里 多地回应

网传新能源汽车开征“里程税” 收费0.12元/公里 多地回应

快科技
2026-02-27 21:58:15
AI会在所有事情上超越我们!3800亿估值公司CEO警告:海啸将至人类却假装没看到

AI会在所有事情上超越我们!3800亿估值公司CEO警告:海啸将至人类却假装没看到

知识圈
2026-02-27 16:57:06
保住联盟第一!活塞加时险胜无哈登骑士 杜伦33+16三人6犯

保住联盟第一!活塞加时险胜无哈登骑士 杜伦33+16三人6犯

醉卧浮生
2026-02-28 11:33:18
2026-02-28 13:12:49
国际与比较教育研究所 incentive-icons
国际与比较教育研究所
中国教育科学研究院
418文章数 407关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

牛弹琴:伊朗面临生死存亡关键时刻 信号已经很明显了

头条要闻

牛弹琴:伊朗面临生死存亡关键时刻 信号已经很明显了

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

疑似王一博被爆私密聊天记录

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

教育
健康
数码
旅游
房产

教育要闻

15000名火花“小老师”,创造最大线上数学解题视频集世界纪录

转头就晕的耳石症,能开车上班吗?

数码要闻

移动办公新物种:联想ThinkBook模块化AI PC概念前瞻

旅游要闻

数字平台成入境游关键动能,携程带动消费240亿美元

房产要闻

重磅!海南“十五五”规划出炉!未来五年,方向定了!

无障碍浏览 进入关怀版