网易首页 > 网易号 > 正文 申请入驻

数字教育理事会发布AI重塑评估报告

0
分享至


2025年7月7日,数字教育理事会(Digital Education Council,成立于2024年,是一个由100多家机构组成的全球实践共同体,致力于推动高等教育和劳动力发展领域的可持续创新和AI应用,总部位于新加坡)与培生集团(Pearson)联合发布《评估的新时代:AI在评估设计中的全球综述》(The Next Era of Assessment:A Global Review of AI in Assessment Design),首次全面梳理了全球教育工作者如何利用AI重塑评估体系。报告聚焦高等教育领域,具体从AI对评估各环节的影响、AI时代的评估体系重构及实践指南等方面进行了分析。

一、AI对评估各个环节的影响

评估一般包括设定学习目标(Set Learning Outcomes)、规划课程(Plan Curriculum)、制定评估(Develop Assessments)、评估实施(Assessment Delivery)、反馈与改进(Feedback and Review)5个环节。该报告从AI可对各个环节带来哪些可能性和针对AI需做出哪些调整两个维度进行了分析。


1.AI对设定学习目标环节的影响

可能性——通过分析劳动力市场数据等大规模数据集,识别技能缺口并制定与时俱进的学习目标;自动化常规任务使学生能专注于高阶认知活动,推动评估向批判性和复杂技能发展。

必要调整——评估需纳入AI相关能力指标,如AI输出评估、负责任使用AI等;明确区分需独立掌握的技能和可通过AI强化的技能。

2.AI对规划课程环节的影响

可能性——基于预期学习成果自动生成课程体系建议;根据学生画像提供个性化学习路径设计。

必要调整——划课程时需明确AI工具的使用规范;增设AI工具使用相关的伦理教育内容;平衡人类核心能力与AI技能的培养。

3.AI对制定评估环节的影响

可能性——自动生成测验题、案例分析和评分标准;作为写作辅助工具或模拟器参与评估设计;通过模拟真实场景提升评估真实性。

必要调整——重构评估形式以减少对AI的依赖;从结果导向转向过程评估;更新评分标准以鼓励原创性和批判性思维。

4.AI对评估实施环节的影响

可能性——实时反馈指导学生改进;自动化监考功能;通过AI角色扮演增强情景化评估。

必要调整——明确每项评估的AI使用规则;增加现场考核环节确保评估真实性;记录学生完成任务的过程性证据。

5.AI对反馈与改进环节的影响

可能性——协助评分并提供个性化反馈;对评估数据进行大规模分析以辅助改进;生成课堂表现概要并提出改进评估建议。

必要调整——建立定期评估更新机制,确保评估工具始终有效抵御AI演进带来的挑战。

二、重新思考AI时代的评估

报告认为,AI时代评估设计需要从多个层面进行审慎考量——从单项任务到贯穿整个课程的评估组合。这一重构过程主要围绕三个关键维度展开:评估类型、评估设计原则和评估组合。

1.评估类型:在完成单项评估任务时,人工智能应扮演何种角色?

根据具体学习目标和AI使用对目标实现的影响程度,确定评估应采用"AI禁用型"(AI-Free Assessment)、"AI辅助型"(AI-Assisted Assessment)还是"AI融合型"(AI-Integrated Assessment)模式(见表1)。

表1 AI评估分类

类型

使用场景

核心特征

AI禁用型评估

专门设计为无需AI协助完成的评估

评估的目标、能力和设计本身有意排除或减少对AI的运用,而侧重于学生独立思考的能力以及基础技能的培养

AI辅助型评估

在明确边界内允许使用AI完成特定任务(如头脑风暴、大纲拟定)

评估的目标、能力和结构允许AI作为一种支持工具发挥作用,鼓励使用基本的AI来提供帮助或反馈,同时确保学生主导的学习仍占据主导地位

AI融合型评估

将AI工具作为学习和评估体验的有机组成部分

评估的目标、能力和提示要求学生有意义的参与AI作为核心部分的任务,包括在其学科领域内应用、批判和反思AI

2.评估设计原则:如何确保所有评估在AI存在的情况下仍保持效度和信度?

抗AI干扰性(AI-Resilient)原则正逐渐成为保障各类评估有效性与完整性的关键设计原则。这种抗干扰性设计并非依赖学生的自觉遵守,而是通过精心构建条件与框架,使学生难以借助AI完成核心学习任务,从而确保核心学习成果不会被轻易外包给AI。实现抗AI干扰性不仅需要更新规则或技术,更需要对评估体系进行结构性重构。教育工作者可采用多种创新策略重构评估方式以实现这一目标(见表2)。

表2 重构评估以实现抗AI干扰性的策略

策略

描述

示例

课堂上保持人类核心任务

将评估拆分为多个部分——允许AI承担课外可执行的任务,但需将批判性思维、讨论和阐释环节保留在结构化且有监督的教学环境中

学生在家中使用AI进行头脑风暴并起草方案,但在课堂上需现场陈述论点并即时回应提问

将关注点从“输出”转向“过程”

评估导致最终结果的推理、规划和决策过程,而不仅仅是结果本身。鼓励元认知层面的参与。

学生在最终提交的作品中需记录并反思影响其工作的AI交互过程,或对解决方案提供合理性说明

嵌入检查点与可追溯发展

引入结构化里程碑,例如中期提交、现场讨论、反馈循环或规划工件,以展示学生的渐进式思维

在课堂上组织同伴讨论与反馈环节,并要求学生根据反馈意见修改作业

单元层面而非任务层面的效度验证

需认识到并非所有评估方式都能完全规避人工智能的影响。相反,应通过单元或课程中一系列相互关联的评估来验证学生的学习成效。其中每项评估都基于学生先前的作业成果,并以贴合其学习情境的方式递进构建。

学生在四节课中逐步完成最终作品——从概念构思开始,到最终的互动展示结束。

每个阶段都要求学生基于前期成果完成不同的任务。有效性体现在四节课之间的连贯性与递进性,而非单一任务的表现。

3.评估组合:如何组合不同类型的评估,以同时培养基础能力和面向未来的AI技能?

在课程层面,教师应确保其评估体系能同时支持人类核心能力(基础知识、批判性思维、学科专业知识以及独立技能)与AI相关技能(有效且合乎道德地使用AI工具的能力、支持反映未来职场需求的形成性与真实性评估)的培养。


基于已有研究,数字教育委员会提出“双优先级方法”,旨在帮助教师有意识地在各类评估中平衡这两个互补目标。三种评估类型可在这两个优先级框架下发挥不同作用(见表3)。

表3 支持类型总结

评估类型

优先级1:人类能力

优先级2:人机协作

AI禁用型评估

主要关注点

不适用

AI辅助型评估

关键关注点

培养基础AI技能

AI融合型评估

需精心设计以支持人类能力培养

关键关注点

教师不应孤立地设计评估方式,而应有意识地规划和多样化评估手段,以便在整个课程中兼顾这两个优先级。

三、AI时代评估设计指南

该报告针对三类评估均提出了具体的实践建议,并重点介绍了AI融合型评估的实践路径。

1.AI禁用型评估

报告指出,在设计旨在培养或测试学生独立思考和基础技能的评估时(AI禁用型评估),关键在于从结构上消除使用AI的可能性,而非仅发布“禁用AI”的规定并寄希望于学生自觉遵守。解决方案在于构建具有内在抗AI干扰性的评估体系。其中最有效方法是将异步评估转为同步评估,从根本上阻断学生在完成任务时接触AI的途径。监考测试、口试、课堂写作研讨会、实时演讲或课堂讨论等形式在结构上天然具备抵御AI干扰的特性。这些同步评估模式并非通过监控手段,而是通过消除使用机会来降低AI滥用的可能性。

然而,要求所有作业都采用这种形式并不现实,尤其是那些支持持续性形成性学习的评估,为此,教师还可以通过设计能利用AI当前缺陷的任务,使得AI难以或无法代学生完成任务。具体策略包括:

情境化应用任务——要求学生将知识或技能应用于本地情境、时事热点或近期课堂讨论,这些背景信息通常超出AI的获取与解读能力范围。

过程性文档记录——要求学生提交思维过程的实证材料,如带批注的草稿、规划笔记或语音备忘录,以展示其观点随时间演进的轨迹。

2.AI辅助型评估

报告指出,在允许学生将AI应用于评估时,教育者必须审慎考量其适用场景与限制边界,以确保AI技术能有效支持——而非削弱——既定教学目标。

AI可参与评估流程的多个环节。报告给出了以下使用导图(见表4),系统梳理了学生在作业中可能接触AI的关键节点。

教师可参照此导图,将AI应用与具体学习目标精准对接,明确划定允许使用、限制使用或需提供明确指导的领域。对于需要限制AI使用的评估环节,教师应着力重构这些评估要素以增强其“抗AI干扰性”,而非单纯依赖学生的自律遵守。

表4 AI使用导图

阶段

关键AI接触点

规划阶段

头脑风暴/框架建议/时间规划

研究阶段

关键词推荐/文献检索/文献综述/术语解释/提出论点或观点/方法设计

创作阶段

大纲生成/初稿撰写/生成部门内容/图表制作/内容整合

修改阶段

语句润色/语法检查/反论证模拟/修正参考列表/缩短或延长/错误修正

反馈与反思阶段

生成评价/促进反思/对照评分标准

3.AI融合型评估

报告指出,AI通过引入评估学习进程的新方法、增强与现实场景的关联性以及赋能AI相关能力的发展,为革新测评实践展现出巨大潜力。

基于101个全球案例研究,报告将AI融合型评估进一步总结为两种主要方法:一是利用AI技术提升传统评估方式,即利用AI辅助核心学科学习;二是将AI作为研究对象,重点培养学生的AI素养。围绕这两种方法,报告归纳出14种新兴的AI融合型评估设计方法,并将其与特定的学习目标和AI能力(例如提示词设计、AI输出评估和AI伦理)进行了对应分析(见下表5和6),并给出了每一种方法的具体实践案例。

表5 用于增强传统评估的新兴AI融合设计方法

方法论

描述

最适合达成的学习成果

最适合培养的AI能力

01 AI引导的自我评估与反思

学生与AI工具进行结构化对话,以测试、解释或评估自己对某个概念或论点的理解。

•自我反思

•输入设计与信息质量

•概念理解

•AI反思与元认知

02 AI先行,人工修订

学生首先使用生成式AI工具生成初稿或解决方案,然后对其进行评估、修订和扩展。

•文本/文学分析

•AI输出评估

•过程改进与评估

•AI偏见与限制意识

03 人工先行,AI评审

学生先独立完成任务,然后使用生成式AI工具来评审和改进自己的作品。

•过程改进与评估

•AI反思与元认知

•概念理解

•AI输出评估

04 AI生成分析材料

AI生成样本材料(如案例、解决方案),学生随后运用学科方法对其进行分析、解读或解决。

•定量/数据分析

•AI输出评估

•概念理解

•AI偏见与限制意识

05 AI作为模拟协作者或角色扮演者

学生与模拟某个角色、专家或真实人物的AI进行互动。

•沟通

•AI输出评估

•自我反思

•AI整合与应用

06 用于沉浸式学习的AI

学生使用生成式AI工具创造丰富的体验,以加深对学科概念的理解。

•概念理解

•AI整合与应用

•创造力与创新

•输入设计与信息质量

07 人工与AI工作成果比较

学生对同一项任务中人工完成和AI生成的结果进行分析和比较。

•过程改进与评估

•AI输出评估

•自我反思

•AI偏见与限制意识

08 AI作为助手

学生在任务的一个或多个阶段将AI工具作为协作者使用。

•沟通

•AI整合与应用

•研究与调查

•输入设计与信息质量

表6. 以AI为主要研究对象的新兴AI融合设计方法

方法论

描述

最适合达成的学习成果

最适合培养的AI能力

01 AI输出批判与评估

学生批判性地评估AI生成内容的质量、准确性或偏见。

•自我反思

•概念理解

•AI输出评估

•AI反思与元认知

02 提示词工程与过程分析

学生尝试设计AI提示词,并反思输入设计如何影响输出结果。

•概念理解

•协作与团队合作

•AI输出评估

•输入设计与信息质量

03 AI伦理、政策与社会影响

学生通过辩论、反思或政策设计,探讨AI的伦理、法律和社会影响。

•自我反思

•伦理与责任

•AI反思与元认知

•AI伦理与负责任使用

04 建设性误用

学生有意地“误用”AI至其极限,以揭示其缺陷或偏见。

•概念理解

•伦理与责任

•AI输出评估

•AI伦理与负责任使用

05 AI作为情境化案例研究

AI被用作一个透镜,来探索特定学科领域内的概念。

•自我反思

•概念理解

•AI伦理与负责任使用

•AI反思与元认知

06 AI作为人造产物

学生设计或定制自己的AI工具。

•过程改进与评估

•实际应用

•AI整合与应用

•AI伦理与负责任使用

资料来源:

Digital Education Council. The Next Era of Assessment: A Global Review of AI in Assessment Design. https://www.digitaleducationcouncil.com/post/the-next-era-of-assessment-a-global-review-of-ai-in-assessment-design

[本文为教育部国别和区域研究基地中国教育科学研究院国际教育研究中心成果]


本文由中国教育科学研究院“教育国际前沿”课题组整理,课题组负责人张永军,编辑刘强。点击左下角阅读原文可下载该文献。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒋介石恐做梦也没想到,当年他不让姓蒋的后代,最终却代表了蒋家

蒋介石恐做梦也没想到,当年他不让姓蒋的后代,最终却代表了蒋家

抽象派大师
2026-01-10 11:57:58
为什么车厘子历经一个月到中国还不坏?买回家没几天就坏了?

为什么车厘子历经一个月到中国还不坏?买回家没几天就坏了?

科普中国
2026-01-10 11:22:06
“一天才花46元,父母还嫌我费钱”,女大学生哭诉:读不下去了!

“一天才花46元,父母还嫌我费钱”,女大学生哭诉:读不下去了!

妍妍教育日记
2026-01-07 20:31:13
王楚钦新图鲨疯了!硬朗西装杀伤力太大,这男人味谁顶得住?

王楚钦新图鲨疯了!硬朗西装杀伤力太大,这男人味谁顶得住?

娱乐领航家
2026-01-10 16:18:41
一颗榴莲,快让东南亚卷成“晋西北”了!

一颗榴莲,快让东南亚卷成“晋西北”了!

流苏晚晴
2026-01-07 20:13:10
中国财政供养人员达6846万?结构失衡才是财政压力的核心

中国财政供养人员达6846万?结构失衡才是财政压力的核心

流苏晚晴
2025-12-04 19:27:08
台湾回归后,第一任省长由谁担任合适?这四人是否在候选人名单中

台湾回归后,第一任省长由谁担任合适?这四人是否在候选人名单中

谈古论今历史有道
2025-12-22 15:20:03
老道士揭秘:家中这三样东西消失,一定是被人借运了!千万要小心

老道士揭秘:家中这三样东西消失,一定是被人借运了!千万要小心

古怪奇谈录
2026-01-05 11:32:51
中国最后一位太监孙耀庭自述:晚上伺候娘娘时,鞋底必须藏苍耳

中国最后一位太监孙耀庭自述:晚上伺候娘娘时,鞋底必须藏苍耳

妙知
2025-08-28 10:19:43
陈赫陪老婆逛香奈儿,42岁张子萱一头黄发好高级,又高又美!

陈赫陪老婆逛香奈儿,42岁张子萱一头黄发好高级,又高又美!

喜欢历史的阿繁
2026-01-10 11:57:05
杜锋祭出最强阵容,杨鸣临时增援补强,辽粤大战胜算几何?

杜锋祭出最强阵容,杨鸣临时增援补强,辽粤大战胜算几何?

大嘴说台球
2026-01-10 11:16:22
60年一遇!今年春节不用穿棉袄了?最冷时段,已经确定!

60年一遇!今年春节不用穿棉袄了?最冷时段,已经确定!

老特有话说
2026-01-10 15:37:26
机会不足,他在曼城依旧坚守?

机会不足,他在曼城依旧坚守?

篮球看比赛
2026-01-10 15:10:45
77年,邓华重返军队,记下了下放时4个将领的名字:他们帮过我

77年,邓华重返军队,记下了下放时4个将领的名字:他们帮过我

抽象派大师
2026-01-09 08:51:38
年薪近300万!香港立法会换届,这份高官薪酬名单让全网酸了……

年薪近300万!香港立法会换届,这份高官薪酬名单让全网酸了……

港港地
2026-01-09 19:34:45
解气!新党出手了,让窜台的石平当场想钻地缝,这就是汉奸的下场

解气!新党出手了,让窜台的石平当场想钻地缝,这就是汉奸的下场

DS北风
2026-01-09 18:18:09
最新通知:天津这项电价调整!1月1日起执行!

最新通知:天津这项电价调整!1月1日起执行!

天津人
2026-01-10 11:34:33
为何越南人认为广州是他们失去的故都?广东,对越南意味着什么?

为何越南人认为广州是他们失去的故都?广东,对越南意味着什么?

乐天闲聊
2025-12-27 11:00:50
詹姆斯承认一事实,雷迪克替东契奇辩解!字母评价老詹,艾顿该批

詹姆斯承认一事实,雷迪克替东契奇辩解!字母评价老詹,艾顿该批

鱼崖大话篮球
2026-01-10 15:46:41
库兹马未婚妻观战雄鹿险胜湖人!本赛季多次现场看球 好事将近?

库兹马未婚妻观战雄鹿险胜湖人!本赛季多次现场看球 好事将近?

Emily说个球
2026-01-10 16:01:30
2026-01-10 16:56:49
国际与比较教育研究所 incentive-icons
国际与比较教育研究所
中国教育科学研究院
398文章数 407关注度
往期回顾 全部

科技要闻

传DeepSeek准备第二次震惊全世界

头条要闻

闫学晶"哭穷"后多账号被禁止关注 其代言品牌:将索赔

头条要闻

闫学晶"哭穷"后多账号被禁止关注 其代言品牌:将索赔

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

游戏
数码
艺术
旅游
时尚

主播抨击《ARC Raiders》作弊猖獗 开发商正在应对

数码要闻

当追觅让泳池机器人长出了“手”,我拥有了真正“懂我的家”

艺术要闻

你能认出毛主席手书的全部吗?揭秘其中隐藏的秘密!

旅游要闻

视点|点亮王四营乡文旅新地标!朝悦茶村正式开业

专栏 | 做“主语”的体验

无障碍浏览 进入关怀版