网易首页 > 网易号 > 正文 申请入驻

周伯文:缺乏专业推理能力是当下前沿模型的一大短板

0
分享至

“科学发现是AI的下一个前沿阵地,大规模深度推理将赋能科学发现,科学发现亦将反哺推理能力的进化。”上海人工智能实验室主任、首席科学家周伯文日前在第四十届人工智能协会年会(AAAI 2026)发布特邀报告。周伯文表示,当前我们已身处通用人工智能的前夕,但仍缺失通专融合的智能,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。

AGI必须打破通专二元对立

人工智能的发展历程并非线性堆叠,而是呈现出明显的阶段性跃迁。回顾AI发展的历史坐标,有助于厘清当前所处的位置及未来的方向。

早在1996年涉足AI研究之初,周伯文便开始思考智能的本质,在担任IBM人工智能基础研究院院长期间便提出了通往通用人工智能的战略路线图,将AI发展分为三个关键阶段:ANI(狭义人工智能)、ABI(广义人工智能)与AGI。

在周伯文看来,ANI在2016年已趋于成熟,而通往AGI的必经之路并非直接跃迁,而是必须率先实现具备跨领域泛化能力的ABI。这一跨越需要技术范式的根本性变革,最少包括从有监督学习转向自监督学习、从人类分割任务级联式系统转向端到端架构、从判别式工具进化为生成式助手。ChatGPT的问世第一次验证了人工智能系统同时达成这三方面变革,实质上宣告了ABI阶段的到来。这一历史性突破验证了规模法则(Scaling Law)的有效性,通过扩大Transformer架构并将“下一个词预测”作为优化目标,人类首次实现了对世界知识的压缩。

Scaling Law赋予大语言模型广泛的泛化能力(ABI),通往AGI的下一步,不仅仅是计算量的堆叠,“通专融合”是一条可探索的路径,其核心思想是动态实行融合人类认知思维的“系统1”(直觉式快思考)和“系统2”(逻辑式慢思考),以应对各种现实世界的任务。

过去70年,AI的发展长期在“专业性”与“通用性”两个维度上分别进展。以AlphaFold为代表的早期系统是极致的“专家”,在特定领域超越人类却缺乏迁移能力;而当前的大语言模型则是博闻广识的“通才”,虽具广度但在处理复杂专业任务时往往难以企及专家深度和缺失关键细节。

周伯文表示,真正的AGI必须打破这种二元对立,构建一种能够动态融合系统1与系统2的智能架构,即在保持通用认知基座的同时,能够在任意特定任务上通过持续学习与深度推理实现专家级的专精。上海AI实验室提出的智者SAGE技术架构便是旨在弥合广泛泛化与深度专精鸿沟的统一认知生态系统。

过度依赖现有模型可能阻碍创新

人工智能的下一个前沿领域是什么?周伯文认为是科学发现(Scientific Discovery, SD)。“除了科学智能(AI for Science, AI4S)所承诺的治愈癌症等诸多益处之外,科学发现更是推理智能的终极考验,因此也是AI探索的绝对前沿。”他表示,科学发现是已知与未知之间复杂的相互作用,涵盖了从假设生成、实验验证到理论总结的全过程。

这对AI提出了三重挑战:一是已知的未知,典型的如组合爆炸,比如分子设计或材料科学的搜索空间高达量级,远超传统遍历能力;二是未知的未知,科学探索本质上是对分布外知识的泛化,是对模型创造力的真正考验;三是稀疏与延迟奖励,科学实验的周期长、反馈慢,是对强化学习算法的严峻测试。

尽管以AlphaFold为代表的AI for Science(AI4S)技术在蛋白质折叠、气象预测等特定领域取得了里程碑式成就,但近期《Nature》发表的研究指出,过度依赖现有深度学习模型可能局限新知识的探索边界,甚至在某种程度上阻碍创新。

周伯文表示,擅长处理数据充足、定义明确任务的传统深度学习,如果仅作为工具存在,难以应对科学发现中“未知的未知”。系统性的评估进一步揭示了当前前沿模型的短板。上海人工智能实验室联合来自10个不同科学领域的100位科学家设计了评估体系,结果显示,前沿模型在通用科学推理任务中得分可达50分(满分为100分),但在专项文献检索、具体实验方案设计等各类专业推理任务中,得分骤降至15-30分。

这种明显的木桶效应表明,科学发现全周期的效能正受制于专业推理能力的薄弱环节。因此,整合通用推理与专业能力,进而推动科学智能从AI4S向AGI4S迭代成为必然选择。从AI4S迈向AGI4S,这一升级旨在推动研究者、研究工具与研究对象的协同演进。通过AGI促进三者相互作用、协同演进、螺旋式上升,将创造出真正革命的工具,推动科研范式变革。

周伯文表示,当前我们已身处通用人工智能的前夕,但仍缺失通专融合的智能,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。他认为,可深度专业化通用模型(Specializable Generalist)是实现AGI的可行路径,其关键挑战与思路在于,专家化模型在训练过程中需要低成本、能规模化的密集反馈,能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力。

澎湃新闻记者 张静

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人民日报:茅盾文学奖最值得看的10本书,读懂受益终生

人民日报:茅盾文学奖最值得看的10本书,读懂受益终生

洞见
2026-06-02 22:18:28
全是眼泪!《主角》48集大结局:4人下线,忆秦娥丧夫又丧子!

全是眼泪!《主角》48集大结局:4人下线,忆秦娥丧夫又丧子!

阿纂看事
2026-06-03 20:03:25
刷屏!北京大学饶毅教授直言:中国学术不端比例世界空前

刷屏!北京大学饶毅教授直言:中国学术不端比例世界空前

TOP大学来了
2026-06-02 19:24:41
俞敏洪抛出惊人言论:我有两个大学男同学已经死了,都是家庭条件很好,但俩人没有抵抗挫折和不幸的能力

俞敏洪抛出惊人言论:我有两个大学男同学已经死了,都是家庭条件很好,但俩人没有抵抗挫折和不幸的能力

心理观察局
2026-06-03 07:17:10
退休国企干部、公职人员起诉离婚,庭审互揭老底牵出巨额财产线索;法院:涉嫌犯罪,移送公安、纪检监察

退休国企干部、公职人员起诉离婚,庭审互揭老底牵出巨额财产线索;法院:涉嫌犯罪,移送公安、纪检监察

大风新闻
2026-06-03 19:48:17
CBA最新消息!北控男篮主帅确定,杜锋完成签约

CBA最新消息!北控男篮主帅确定,杜锋完成签约

体坛瞎白话
2026-06-03 16:00:25
美国公司心真大,想重返月球,发动机外包给印度,结果被炸回原形

美国公司心真大,想重返月球,发动机外包给印度,结果被炸回原形

王新喜
2026-06-02 13:23:55
肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

奇思妙想草叶君
2026-06-02 19:15:06
王月眉,被驱逐出中国!

王月眉,被驱逐出中国!

新动察
2026-06-03 14:10:21
傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

映射生活的身影
2026-06-03 15:48:06
惯子如杀子,十大惯子特征,条条戳心

惯子如杀子,十大惯子特征,条条戳心

十点读书
2026-06-02 19:19:10
中美俄英法都在名单里,印媒公开喊话环球时报:凭啥就没有印度?

中美俄英法都在名单里,印媒公开喊话环球时报:凭啥就没有印度?

福建睿平
2026-06-03 08:03:32
无视680万奖金!曝国足放弃参加东盟杯 9月另寻西亚+中亚对手热身

无视680万奖金!曝国足放弃参加东盟杯 9月另寻西亚+中亚对手热身

我爱英超
2026-06-03 20:08:15
北京上海失业保险领取人数激增!当务之急之重先稳就业

北京上海失业保险领取人数激增!当务之急之重先稳就业

风向观察
2026-06-03 18:58:55
圣彼得堡经济论坛召开之际,乌克兰无人机来了

圣彼得堡经济论坛召开之际,乌克兰无人机来了

山河路口
2026-06-03 14:23:11
“King Sir”钟景辉,今早睡梦中去世

“King Sir”钟景辉,今早睡梦中去世

南方都市报
2026-06-03 16:06:22
日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

互联鱼
2026-06-02 19:32:57
带孩子逛山姆是托举后续:遭网曝后道歉,全家被牵连,丈夫要算账

带孩子逛山姆是托举后续:遭网曝后道歉,全家被牵连,丈夫要算账

奇思妙想草叶君
2026-06-03 02:25:44
不想上班?辞职上山的年轻人最后还是下山了

不想上班?辞职上山的年轻人最后还是下山了

红星新闻
2026-06-03 20:56:44
“崩老头”专盯80、90后:记者卧底500人群聊,如此魔幻

“崩老头”专盯80、90后:记者卧底500人群聊,如此魔幻

半耳聆
2026-06-03 18:15:39
2026-06-03 23:16:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
902533文章数 5091917关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

公司半夜通知全员放假一夜搬空 员工被拖欠数百万工资

头条要闻

公司半夜通知全员放假一夜搬空 员工被拖欠数百万工资

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

艺术
亲子
本地
公开课
军事航空

艺术要闻

二十年前割麦的场景

亲子要闻

#闪闪小葵花成长正当时 亲子欢乐派对圆满收官 游戏、展演、问答轮番上线,乐享亲子时光

本地新闻

用杨柳青年画的方式,打开天津

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

媒体:美伊和谈以方却从中作梗 内塔尼亚胡有私人算计

无障碍浏览 进入关怀版