网易首页 > 网易号 > 正文 申请入驻

周伯文:缺乏专业推理能力是当下前沿模型的一大短板

0
分享至

“科学发现是AI的下一个前沿阵地,大规模深度推理将赋能科学发现,科学发现亦将反哺推理能力的进化。”上海人工智能实验室主任、首席科学家周伯文日前在第四十届人工智能协会年会(AAAI 2026)发布特邀报告。周伯文表示,当前我们已身处通用人工智能的前夕,但仍缺失通专融合的智能,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。

AGI必须打破通专二元对立

人工智能的发展历程并非线性堆叠,而是呈现出明显的阶段性跃迁。回顾AI发展的历史坐标,有助于厘清当前所处的位置及未来的方向。

早在1996年涉足AI研究之初,周伯文便开始思考智能的本质,在担任IBM人工智能基础研究院院长期间便提出了通往通用人工智能的战略路线图,将AI发展分为三个关键阶段:ANI(狭义人工智能)、ABI(广义人工智能)与AGI。

在周伯文看来,ANI在2016年已趋于成熟,而通往AGI的必经之路并非直接跃迁,而是必须率先实现具备跨领域泛化能力的ABI。这一跨越需要技术范式的根本性变革,最少包括从有监督学习转向自监督学习、从人类分割任务级联式系统转向端到端架构、从判别式工具进化为生成式助手。ChatGPT的问世第一次验证了人工智能系统同时达成这三方面变革,实质上宣告了ABI阶段的到来。这一历史性突破验证了规模法则(Scaling Law)的有效性,通过扩大Transformer架构并将“下一个词预测”作为优化目标,人类首次实现了对世界知识的压缩。

Scaling Law赋予大语言模型广泛的泛化能力(ABI),通往AGI的下一步,不仅仅是计算量的堆叠,“通专融合”是一条可探索的路径,其核心思想是动态实行融合人类认知思维的“系统1”(直觉式快思考)和“系统2”(逻辑式慢思考),以应对各种现实世界的任务。

过去70年,AI的发展长期在“专业性”与“通用性”两个维度上分别进展。以AlphaFold为代表的早期系统是极致的“专家”,在特定领域超越人类却缺乏迁移能力;而当前的大语言模型则是博闻广识的“通才”,虽具广度但在处理复杂专业任务时往往难以企及专家深度和缺失关键细节。

周伯文表示,真正的AGI必须打破这种二元对立,构建一种能够动态融合系统1与系统2的智能架构,即在保持通用认知基座的同时,能够在任意特定任务上通过持续学习与深度推理实现专家级的专精。上海AI实验室提出的智者SAGE技术架构便是旨在弥合广泛泛化与深度专精鸿沟的统一认知生态系统。

过度依赖现有模型可能阻碍创新

人工智能的下一个前沿领域是什么?周伯文认为是科学发现(Scientific Discovery, SD)。“除了科学智能(AI for Science, AI4S)所承诺的治愈癌症等诸多益处之外,科学发现更是推理智能的终极考验,因此也是AI探索的绝对前沿。”他表示,科学发现是已知与未知之间复杂的相互作用,涵盖了从假设生成、实验验证到理论总结的全过程。

这对AI提出了三重挑战:一是已知的未知,典型的如组合爆炸,比如分子设计或材料科学的搜索空间高达量级,远超传统遍历能力;二是未知的未知,科学探索本质上是对分布外知识的泛化,是对模型创造力的真正考验;三是稀疏与延迟奖励,科学实验的周期长、反馈慢,是对强化学习算法的严峻测试。

尽管以AlphaFold为代表的AI for Science(AI4S)技术在蛋白质折叠、气象预测等特定领域取得了里程碑式成就,但近期《Nature》发表的研究指出,过度依赖现有深度学习模型可能局限新知识的探索边界,甚至在某种程度上阻碍创新。

周伯文表示,擅长处理数据充足、定义明确任务的传统深度学习,如果仅作为工具存在,难以应对科学发现中“未知的未知”。系统性的评估进一步揭示了当前前沿模型的短板。上海人工智能实验室联合来自10个不同科学领域的100位科学家设计了评估体系,结果显示,前沿模型在通用科学推理任务中得分可达50分(满分为100分),但在专项文献检索、具体实验方案设计等各类专业推理任务中,得分骤降至15-30分。

这种明显的木桶效应表明,科学发现全周期的效能正受制于专业推理能力的薄弱环节。因此,整合通用推理与专业能力,进而推动科学智能从AI4S向AGI4S迭代成为必然选择。从AI4S迈向AGI4S,这一升级旨在推动研究者、研究工具与研究对象的协同演进。通过AGI促进三者相互作用、协同演进、螺旋式上升,将创造出真正革命的工具,推动科研范式变革。

周伯文表示,当前我们已身处通用人工智能的前夕,但仍缺失通专融合的智能,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。他认为,可深度专业化通用模型(Specializable Generalist)是实现AGI的可行路径,其关键挑战与思路在于,专家化模型在训练过程中需要低成本、能规模化的密集反馈,能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力。

澎湃新闻记者 张静

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
年年体检正常,突然查出肝癌晚期,医生指着CT说:这里去年就有了

年年体检正常,突然查出肝癌晚期,医生指着CT说:这里去年就有了

健身狂人
2026-04-03 15:03:01
人到晚年才明白,每月8000的退休金,没有子女养老,根本就是做梦

人到晚年才明白,每月8000的退休金,没有子女养老,根本就是做梦

人间百态大全
2026-04-02 07:20:03
猪油再次被关注!医生发现:高血压患者常吃猪油,或出现几种变化

猪油再次被关注!医生发现:高血压患者常吃猪油,或出现几种变化

蜉蝣说
2026-02-23 21:23:05
日本茨城县政府鞠躬道歉:不会发生第二次了!

日本茨城县政府鞠躬道歉:不会发生第二次了!

今日日本
2026-04-05 13:33:18
NASA宇航员带了4部iPhone登月,零重力抛手机画面流出

NASA宇航员带了4部iPhone登月,零重力抛手机画面流出

码上闲叙
2026-04-03 10:58:45
美国:2架运输机执行救援任务时“被困”,已炸毁

美国:2架运输机执行救援任务时“被困”,已炸毁

南方都市报
2026-04-05 15:31:26
周恩来在劳山遇刺,11名警卫全部牺牲,调查后才知凶手竟大有来历

周恩来在劳山遇刺,11名警卫全部牺牲,调查后才知凶手竟大有来历

小哥很OK
2025-11-17 21:02:50
这个德国程序员把开源代码卖了3年,才发现客户真正要的不是技术

这个德国程序员把开源代码卖了3年,才发现客户真正要的不是技术

固件更新中
2026-04-03 23:22:04
62岁何赛飞蹲油菜花田,穿布衣白发苍苍,这身材气质谁顶得住?

62岁何赛飞蹲油菜花田,穿布衣白发苍苍,这身材气质谁顶得住?

娱乐领航家
2026-04-04 20:00:03
三甲医生含泪忠告:查出癌症别乱投医,去对医院才是救命第一步

三甲医生含泪忠告:查出癌症别乱投医,去对医院才是救命第一步

王晓爱体彩
2026-04-05 12:40:41
第95波打击!美国命门被炸,特朗普:快停火!中方已回应伊朗求援

第95波打击!美国命门被炸,特朗普:快停火!中方已回应伊朗求援

顾蔡卫
2026-04-05 13:44:21
15年后,全网封神的“犀利哥”程国荣,早已死在了那场流量狂欢里

15年后,全网封神的“犀利哥”程国荣,早已死在了那场流量狂欢里

探源历史
2026-04-05 04:05:07
中国最丑18大建筑:南京卫生巾、昆山螃蟹,不忍直视!

中国最丑18大建筑:南京卫生巾、昆山螃蟹,不忍直视!

秘密即将揭晓
2026-03-25 16:56:26
特朗普发布视频宣称“打死多名伊朗军事领导人”

特朗普发布视频宣称“打死多名伊朗军事领导人”

界面新闻
2026-04-05 07:34:02
中国“捡钱”时代将要来临:若手中只有10万,试下死啃这两条线

中国“捡钱”时代将要来临:若手中只有10万,试下死啃这两条线

混沌录
2026-04-03 17:28:23
王曼昱4-2晋级,马琳表情冷漠,王艺迪王励勤观战

王曼昱4-2晋级,马琳表情冷漠,王艺迪王励勤观战

李絙在北漂
2026-04-04 23:01:45
这三个国家原本属于中国,独立后一个比一个惨,如今后悔了吗?

这三个国家原本属于中国,独立后一个比一个惨,如今后悔了吗?

老范谈史
2026-04-04 19:15:27
纯电车企仅剩两家,原来李斌才是最懂马斯克的那个人?

纯电车企仅剩两家,原来李斌才是最懂马斯克的那个人?

花朵财经
2026-04-03 16:22:15
破纪录!超越日本只是开始

破纪录!超越日本只是开始

中国新闻周刊
2026-04-04 16:15:41
院长成学术收割机?211 高校院长上任后专利数暴增 14%,专家锐评:三年新院长,十年雪花文

院长成学术收割机?211 高校院长上任后专利数暴增 14%,专家锐评:三年新院长,十年雪花文

生物学霸
2026-04-04 17:11:16
2026-04-05 16:32:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
887403文章数 5089493关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗称击落美C-130运输机 美国:我们自己炸的

头条要闻

伊朗称击落美C-130运输机 美国:我们自己炸的

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

教育
旅游
亲子
手机
公开课

教育要闻

双非本科想要进安徽电网,会不会被卡?

旅游要闻

观特展 买文创 苏州博物馆客流持续攀升

亲子要闻

五个月宝宝非得玩钢琴

手机要闻

不止A20 Pro!iPhone 18 Pro系列还将搭载全新C2、N2芯片

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版