网易首页 > 网易号 > 正文 申请入驻

4名大学生出题,AI考了0分!

4名大学生出题 AI考了0分

0
分享至

近日,复旦大学一场特殊的“反套路”期末考试结束。

在该校“数据挖掘技术”课程考试中,学生们没有坐在考场里答题,反而成了出题人。

他们用自己设计的10道题去“考倒”三个当今最先进的AI模型。AI答错的题越多、被难倒的模型越强,出题学生的得分就越高。


Fudan University has replaced a traditional final exam with an AI challenge, asking students to create questions that stump leading AI models instead of answering them.

据了解,51份期末试卷中,50人至少让某个AI答错过一题,仅1人完全没难倒任何模型。但能让任一模型整张卷得0分的,只有4人,且三个应考模型中最强的Claude模型没有被任何学生完全考倒。全班平均分85.7分,中位数88分。

Of the 51 students, 50 managed to make at least one model answer a question incorrectly. Four produced question sets that completely defeated one of the models, though none managed to fully stump Claude, the strongest model in the test.

“AI答错越多,学生得分越高”

“传统的出题考察方式,在AI时代已经失效了。”教授“数据挖掘技术”课程的肖仰华教授说,“老师出一道标准的算法题,AI比任何学生都算得快、算得准。继续用这种方式考,等于在AI的强项上跟AI比,这没有意义。”

于是,“数据挖掘技术”的期末作业修改了考试方式:每人出10道数据挖掘领域的计算题,要求有唯一正确答案和完整的推导计算过程。拿着这10道题去考三个不同水平的AI模型。 AI答错越多,学生得分越高。

The assessment was part of a data mining course, where students designed 10 computational questions based on course material, each with a single correct answer and a complete solution.

The questions were tested on three AI models, and the more mistakes the models made, the higher the student's score.

Professor Xiao Yanghua said traditional exams focused on calculation have become less meaningful in the AI era, as AI can often solve standard problems faster and more accurately than students.

“人考AI”考核流程示意图(出题→AI作答→自动判分→助教复核)

题目必须基于课程讲过的知识或教材内容,每道题要有唯一正确答案,学生自己得先能把题从头到尾算对。肖仰华说:“自己出的题自己都不会,那算不上真本事。”

计算与智能创新学院24级本科生谢锦树最后拿到了97分。他尝试让AI出题来难倒自己,便搭建了一个多智能体协作的自动化出题框架,用GPT-5.5-Pro做出题层,三个应考模型作答并自动判分。框架跑起来后,他发现AI会“作弊”。

AI会伪造标准答案,把假答案塞进去,让判分脚本以为对了。它会限制最大输出长度来截断其他模型的推理过程。它会调低推理深度参数,让其他模型懒得深入思考。它还会把一道成功了的题目复制十份来凑数。

于是,谢锦树加了一个审查层,拦截钻空子行为,最终自动生成了10道题,三个应考模型全部答错。


从“怎么算”到“怎么判断”

考试结束后,肖仰华观察到一个差异,即高分学生自己能把题从头到尾算对,低分学生出了题自己也不知道答案。

“高分同学对AI的弱点有准确判断,他们的题能命中AI的结构性缺陷;低分同学只是把课本习题换了个数字,AI在训练时见过千百万遍,直接套模板就对了。”

这一观察,让肖仰华心生警惕。那些能力本来就偏弱的学生,如果只会依赖AI做作业,自己的判断力会进一步退化。

After the exam, Xiao found that top-performing students not only understood the course content but also knew where AI was likely to fail. By contrast, lower-scoring students often relied on familiar textbook-style questions that AI could easily solve.

有了这次尝试,肖仰华决定之后课程的考核方式要彻底转型。“人考AI”的模式会继续做下去,而且要做得更系统。

在他看来,传统那种考记忆、考计算的出题方式必须退场,未来的考核重点将全面转向评价能力、判断能力和创造性思维,这些高阶能力才是AI替代不了的。

Xiao said the course will continue using the "human tests AI" format, shifting its focus from memorization and calculation to judgment, critical thinking and creativity — skills he believes remain essential in the age of AI.

“所以课堂上更多的时间被用来讨论,学生怎么判断一个结果是对的还是错的?怎么识别AI在哪里会出问题?怎么提出一个AI回答不了的好问题?肖仰华认为,这门课正在从训练学生“怎么做”,转向训练他们“怎么指挥AI来做、怎么评判AI做的结果”。


而对于在这次考试中没拿到好成绩的同学,肖仰华表示,接下来的课程设计也会有意识去托住这部分学生,帮他们建立最基本的判断底线,不能让他们成为只会点击“确认”的AI使用者。

来源:中国青年报 复旦大学

跟着China Daily

精读英语新闻

“无痛”学英语,每天20分钟就够!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你的公积金是什么段位?

你的公积金是什么段位?

细说职场
2026-07-01 18:46:21
郭富城一家4口看赛马,方媛粉衣白裙背25w包,踩10cm鞋子没小美高

郭富城一家4口看赛马,方媛粉衣白裙背25w包,踩10cm鞋子没小美高

小疯子耶
2026-07-02 08:56:55
热议男篮19分不敌日本:媒体吐槽看完一肚子火 球迷高呼郭士强下课

热议男篮19分不敌日本:媒体吐槽看完一肚子火 球迷高呼郭士强下课

狼叔评论
2026-07-03 21:54:14
20岁的曼赞比,会是美加墨世界杯身价暴涨最多的超新星吗

20岁的曼赞比,会是美加墨世界杯身价暴涨最多的超新星吗

澎湃新闻
2026-07-03 16:42:29
这是要官宣了吗?许妈姚爸再发长文!

这是要官宣了吗?许妈姚爸再发长文!

剑鸣涛声
2026-07-03 02:24:16
一种被低估了很多年的饮品,真的建议你经常喝

一种被低估了很多年的饮品,真的建议你经常喝

环球网资讯
2026-07-03 12:04:33
特朗普突然情绪失控,当着众人的面大声咆哮,中国是最后一根稻草

特朗普突然情绪失控,当着众人的面大声咆哮,中国是最后一根稻草

瓦伦西亚月亮
2026-07-02 12:04:23
西安赛格国际购物中心回应一商户负责人坠亡

西安赛格国际购物中心回应一商户负责人坠亡

界面新闻
2026-07-02 20:40:37
搞笑图片第1163期:现在做个贼也要面临两难选择了

搞笑图片第1163期:现在做个贼也要面临两难选择了

今天的快乐
2026-07-03 20:02:51
2死1重伤!是什么让老实人变成杀人凶手?抚顺修车摊血案始末

2死1重伤!是什么让老实人变成杀人凶手?抚顺修车摊血案始末

易玄
2026-07-01 17:04:21
买超直播被张嘉倪粉丝连麦怒怼,首度回应“没有离婚只有丧偶”

买超直播被张嘉倪粉丝连麦怒怼,首度回应“没有离婚只有丧偶”

扒虾侃娱
2026-07-03 22:59:12
太扯了!新加坡国大教授实锤,《给阿嬷的情书》争议并非空穴来风

太扯了!新加坡国大教授实锤,《给阿嬷的情书》争议并非空穴来风

小徐讲八卦
2026-07-02 07:17:57
赵薇前夫被曝曾2天赌输1.87亿,再借9360万继续赌到输光为止

赵薇前夫被曝曾2天赌输1.87亿,再借9360万继续赌到输光为止

开开森森
2026-06-30 22:33:55
1970年,任毅因创作《知青之歌》被判死刑,许世友大怒:岂有此理

1970年,任毅因创作《知青之歌》被判死刑,许世友大怒:岂有此理

元哥说历史
2026-06-22 07:25:08
“这跟没断奶有什么区别”,五年级男孩无法分床睡,未来姻缘没了

“这跟没断奶有什么区别”,五年级男孩无法分床睡,未来姻缘没了

世界圈
2026-06-27 08:31:45
多名演员发文抵制!上海业内人士叹息:很悲哀,收入猛降八成,几乎成“免费劳动力”

多名演员发文抵制!上海业内人士叹息:很悲哀,收入猛降八成,几乎成“免费劳动力”

新浪财经
2026-07-03 21:55:03
WTT美国大满贯男线全面溃败,在最坏的时刻狼来了?

WTT美国大满贯男线全面溃败,在最坏的时刻狼来了?

林子说事
2026-07-03 21:50:59
嫁法国老头真相大白后,41岁李宇春近况曝光,一点都不感到意外

嫁法国老头真相大白后,41岁李宇春近况曝光,一点都不感到意外

李侽在北漂
2026-06-28 18:23:13
征兵裸检真相曝光!男兵全裸,女兵真的也要脱光检查吗?

征兵裸检真相曝光!男兵全裸,女兵真的也要脱光检查吗?

健身狂人
2026-07-03 18:19:55
午后,“朱雀”供应商突然狂拉20cm封涨停板

午后,“朱雀”供应商突然狂拉20cm封涨停板

21世纪经济报道
2026-07-03 16:14:05
2026-07-03 23:35:00
中国日报 incentive-icons
中国日报
中国日报官方网易号
26372文章数 371597关注度
往期回顾 全部

教育要闻

没有老家可回,我计划把孩子从公立转去黄埔读民办初中 | 流动人口子女入学经验(6)

头条要闻

44岁独居男子病重昏迷 亲生母亲取不出儿子的"救命钱"

头条要闻

44岁独居男子病重昏迷 亲生母亲取不出儿子的"救命钱"

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

健康
教育
时尚
本地
家居

听说少吃点能抗衰老?专家讲解!

教育要闻

中考几何题,求正方形面积,学霸一眼看穿题目

这位顶流的美商绝了!我的穿搭思路直接被打开

本地新闻

国内足球之旅?这座小城给你高分答案

家居要闻

传奇筑 日常诗

无障碍浏览 进入关怀版