网易首页 > 网易号 > 正文 申请入驻

《华尔街日报》:无论我们怎么怀疑,AI模型的能力真的在飞速提升

0
分享至

(关注公众号设为标,获取AI深度洞察)

全文 3,000字 | 阅读约13分钟

作者:Kevin Roose

从2025年开始,才三个月时间,DeepSeek的R1,Grok 3, Claude 3.7 Sonnet, GPT-4.5等先进AI模型相继推出,AI展现了惊人的技术进步速度。

在过去几年里,AI 在多个领域开始超越人类,比如数学、编程和医学诊断等,且它们的能力正日益提升。

或许在 2026 或 2027 年,也可能更早——甚至是今年——就会有 AI 公司宣布他们已经创造出 AGI,即一种能够完成几乎所有人类认知任务的通用型 AI。 届时,关于 AGI 的定义争议以及是否真正达到了 AGI 水准的讨论将不可避免。但这些争论并不重要,真正关键的是,我们正失去对人类级智能的垄断,一个拥有超强 AI 的世界正在到来。

在未来十年里,AI 将创造数万亿美元的经济价值,并改变全球政治和军事格局,掌控这一技术的国家将占据主导地位。各国政府和大型企业对此已有共识,并投入了巨额资金争夺领先地位。

然而,大多数人和机构对现有 AI 的冲击仍毫无准备,更遑论未来更强大的系统。而各国政府也缺乏切实可行的应对方案,既无法有效规避风险,也未能充分利用 AI 带来的机遇。

与此同时,坚决否定 AI 进展的怀疑论者仍在断言 AGI 只是幻想。但他们不仅低估了 AI 的发展速度,还误导公众,让人们对即将到来的变化掉以轻心。 无论你认为 AGI 是人类的福音还是潜在威胁,现在仍难下定论。但可以确定的是,它的到来将引发一系列重大经济、政治和技术问题,而目前,我们仍没有答案。

这些想法听上去或许有些危言耸听。但我并不是一个沉迷科幻的未来主义者,也不是一个炒作 AI 投资的商人,更不是看了太多《终结者 2》后陷入狂想的人。

我是一个记者,花了大量时间与那些构建最先进 AI 系统的工程师、支持这项技术的投资人以及研究其影响的专家交流。而从这些人的言谈中,我逐渐意识到,AI 领域正在发生的变革,远比大多数人想象的更深远。 在 旧金山,AGI 早已不是什么边缘概念。这里的人们谈论"感受到 AGI",而打造超越人类智慧的 AI 已成为 硅谷 一些巨头的明确目标。每周,我都会遇到 AI 领域的工程师和创业者,他们的共识是——变革即将到来,而且规模空前,可能彻底改变世界。

过去一两年间,曾经被认为是'短期预测'的观点(即 AGI 可能会在本十年内实现),如今已经接近成为行业共识。"去年从 OpenAI 离职的独立 AI 政策研究员 Miles Brundage 最近告诉我。

在旧金山湾区之外,大多数人对 AGI 仍然闻所未闻,更谈不上为它的到来做准备。而在新闻行业,认真对待 AI 进展的记者,仍然可能被嘲讽为过度轻信或是为科技公司摇旗呐喊的'吹捧者'"。

坦白说,我能理解这种反应。尽管 AI 已经助力诺贝尔奖级别的科研突破,尽管每周有 4 亿 人在使用 ChatGPT,但现实中,大多数人日常接触到的 AI 仍然让人不耐烦。我能理解那些在 Facebook 上看到满屏 AI 生成垃圾内容,或是被笨拙的客服机器人折腾得焦头烂额的人,他们可能会嘲笑:"就这?还要统治世界?"

我曾经也持怀疑态度,但现在,我不得不承认自己看走了眼。有几件事让我开始重新审视 AI 的发展,并认真对待它的未来影响。

二、行业内部的警钟已敲响

如今 AI 产业中最令人不安的一点是,最了解这项技术的人——领先 AI 公司的工程师和高管们——往往也是对其发展速度最为担忧的一群人。

这种情况并不常见。回到 2010 年,我曾报道社交媒体的崛起。当时,Twitter、Foursquare 和 Pinterest 的内部人士并不会警告他们的产品可能引发社会动荡。Mark Zuckerberg 也不会测试 Facebook,试图找出它是否能被用于制造生物武器或发动网络攻击。

但如今,那些真正掌握 AI 进展信息的人——那些正在打造最先进 AI 系统、能接触到公众尚未见过的技术的工程师——却在警告我们,重大变革近在眼前。领先的 AI 公司已经开始为 AGI 做准备,并在研究其潜在风险,比如它们是否具备欺骗能力,是否会变得更加自主,甚至具备策划复杂计划的能力。

OpenAI 首席执行官 Sam Altman 曾表示:"开始指向 AGI 的系统已经进入视野。"

Google DeepMind 首席执行官 Demis Hassabis 认为,AGI 可能还需要三到五年才能实现。

Anthropic 首席执行官 Dario Amodei(尽管不喜欢 AGI 这一术语,但基本认同其核心概念)上个月告诉我,他认为我们距离"在几乎所有领域都比人类更聪明的 AI" 仅剩一到两年。

或许我们应该对这些预测持保留态度。毕竟,AI 公司的高管可能会因市场炒作而夸大 AGI 进展,以获取更多投资或更高估值。

但许多独立专家——包括 AI 领域的开拓者 Geoffrey Hinton 和 Yoshua Bengio,以及 拜登政府 前 AI 顾问 Ben Buchanan——也持相同看法。此外,许多经济学家、数学家和国家安全领域的专家也在发出类似警告。

当然,并非所有专家都认同 AGI 即将到来。但即使忽略所有 AI 公司的人员,或那些在行业中有既得利益的人,依然有大量独立且权威的声音在发出警示,而这些声音,不容忽视。

在我看来,与专家的预测同样重要的,是 AI 近期的实际进展——对于任何经常使用它的人来说,这些改进都是显而易见的。

回顾 2022 年,当 OpenAI 推出 ChatGPT 时,即便是最先进的 AI 模型仍然会在简单的算术题上犯错,面对复杂推理问题时频频失败,甚至会凭空捏造事实,产生"幻觉"。当时的聊天机器人在特定场景下可以令人惊叹,但远远达不到可以承担关键任务的程度。

而现在,AI 的进步已不可同日而语。专门化模型在 国际数学奥林匹克竞赛(IMO)上达到了奖牌级水平,而通用模型的推理能力已经强大到需要开发更复杂的测试来衡量其能力。虽然 AI 仍然会犯错,但最新模型的幻觉现象已大幅减少。许多企业如今也已将 AI 融入核心业务,直接面向客户提供服务。

这种进步的部分原因在于 AI 模型规模的不断扩大。更庞大的模型、更丰富的数据、更强大的计算资源,通常能带来更优质的性能,而如今的领先模型相比早期版本已经大幅增长。

但这并非唯一因素。近年来,AI 研究在技术层面也取得了重要突破,尤其是"推理"模型的出现。这类模型会在给出答案前进行额外的思考步骤,以提高逻辑推理能力。

例如,OpenAI 的 o1 和 DeepSeek 的 R1 采用了强化学习技术——这一方法曾让 AI 在围棋比赛中超越人类。它们如今能够解决许多以往令模型束手无策的问题。GPT-4o 在 2024 年的 AIME(美国数学邀请赛)上仅得 9%,而几个月后发布的推理模型 o1 在同一测试中的得分高达 74%,展现出惊人的能力飞跃。

这些技术进步使 AI 在白领知识型工作中的应用价值日益凸显。我的同事 Ezra Klein 最近写道,ChatGPT 的高级功能 Deep Research 能够生成深度分析报告,其质量"至少相当于他共事过的研究员的平均水平"。

我自己也发现,AI 工具在工作中的用途越来越广泛。我不会用 AI 直接撰写文章,但它已经成为我的得力助手——帮助我准备采访、总结研究论文,甚至开发个性化应用来处理行政事务。几年前,这些功能几乎难以想象。而且,我很难相信任何认真使用 AI 进行工作的用户会认为它的进步已经停滞。

如果你想真正理解 AI 的进步速度,不妨去问问程序员。一两年前,AI 编码工具的主要作用是提升程序员的工作效率,而不是取代他们。但今天,越来越多的软件工程师告诉我,AI 已经承担了大部分实际编码工作,而他们的角色正逐渐变成 AI 的监督者。

Y Combinator(YC)合伙人 Jared Friedman 近日透露,在 YC 目前孵化的初创公司中,约四分之一几乎完全依赖 AI 编写代码。"如果是一年前,他们还需要从零开始开发产品,"他说,"但现在,95% 的代码都是由 AI 生成的。"

四、未雨绸缪,胜于措手不及

作为一种谨慎的认知态度,我必须承认,我和许多人的预测可能是错误的。 或许 AI 的发展会遇到难以预料的瓶颈——比如能源短缺,使得企业无法建设更大规模的数据中心,或者高性能芯片供应受限,阻碍模型训练。也可能是当前的技术架构和训练方法尚不足以实现 AGI,我们仍需进一步的重大突破。 但即便 AGI 的到来比预期晚十年——比如 2036 年而非 2026 年——我们仍然应该从现在开始做好准备。

实际上,大多数为 AGI 做准备的建议,本质上都是我们本来就该做的事情:升级能源基础设施、强化网络安全、加快 AI 生成药物的审批流程、制定防范 AI 风险的监管规则、在学校推广 AI 素养教育,并将培养重点从即将被淘汰的技术技能转向社会和情感发展。这些举措即便与 AGI 无关,也值得推行。 一些科技界人士担心,过早的恐慌可能会导致 AI 监管过度,扼杀创新。但 特朗普政府 已表态希望加速 AI 发展,而非放慢脚步。同时,各大 AI 公司正投入数千亿美元研发新一代模型,且资金流入仍在加速,因此,这些企业主动踩刹车的可能性微乎其微。

相比过度准备,我更担心的是,许多人在 AI 真正影响他们的生活之前,根本不会意识到它的威力——等到 AI 取代他们的工作、让他们陷入骗局,或直接影响他们的安全时,才会后知后觉。这与社交媒体的崛起如出一辙。Facebook 和 Twitter 早期并未被视为威胁,等到它们对社会产生深远影响,我们才发现监管为时已晚。

这正是为什么,我认为我们应该从现在开始认真对待 AGI,即便它的确切到来时间和具体形式仍然未知。

如果我们选择无视它,或者只是心存侥幸,就可能错失主动塑造这项技术的关键机会——而一旦错失,后果将难以逆转。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:https://www.nytimes.com/2025/03/14/technology/why-im-feeling-the-agi.html

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
谁来追责?浙江医院惊天乱象!花高价挂专家号,等来一场致命误诊

谁来追责?浙江医院惊天乱象!花高价挂专家号,等来一场致命误诊

牛锅巴小钒
2026-06-03 18:48:02
X娃亲妈格莱姆斯:非主流怪异歌手,和马斯克分分合合,生了3个娃

X娃亲妈格莱姆斯:非主流怪异歌手,和马斯克分分合合,生了3个娃

照见古今
2026-06-02 18:17:06
“让人无语!”小区电瓶车扫码充电要过五关,关关都有广告,一不小心就被引导去充值……

“让人无语!”小区电瓶车扫码充电要过五关,关关都有广告,一不小心就被引导去充值……

都市快报橙柿互动
2026-06-03 16:48:38
既然菲方不稀罕中国援助,中方可以成全他们,毛宁打开天窗说亮话

既然菲方不稀罕中国援助,中方可以成全他们,毛宁打开天窗说亮话

羽逸地之光
2026-06-04 02:34:34
苗原:有德甲球队还在打王钰栋的主意,签约后去其他联赛也ok

苗原:有德甲球队还在打王钰栋的主意,签约后去其他联赛也ok

懂球帝
2026-06-03 23:32:54
专科女生考上北大研究生,评论区没人恭喜,全在教她“认清现实”

专科女生考上北大研究生,评论区没人恭喜,全在教她“认清现实”

教育人看世界
2026-06-03 22:02:22
为了证明自己没用AI写论文,这届大学生有多拼

为了证明自己没用AI写论文,这届大学生有多拼

极目新闻
2026-06-04 00:18:49
俄罗斯官媒中文帐号终于被禁!大V司马南是他的深度合作伙伴

俄罗斯官媒中文帐号终于被禁!大V司马南是他的深度合作伙伴

霹雳炮
2026-06-02 23:18:05
1993年对人民大会堂国宴厅进行改造,上海是如何节省上百万外汇

1993年对人民大会堂国宴厅进行改造,上海是如何节省上百万外汇

贱议你读史
2026-06-03 17:44:38
中俄蒙天然气合作谈崩?中方不再对蒙古妥协,普京访华也没用

中俄蒙天然气合作谈崩?中方不再对蒙古妥协,普京访华也没用

暗香暗香
2026-06-03 16:49:13
金平日:与金正日争权失败,驻外30年躲过暗杀,因这件事允许回国

金平日:与金正日争权失败,驻外30年躲过暗杀,因这件事允许回国

阿胡
2025-04-03 13:59:42
这4种嘴巴的女人,天生就是“真命人”,旺夫旺己旺三代

这4种嘴巴的女人,天生就是“真命人”,旺夫旺己旺三代

风月观主
2026-06-04 08:30:17
“第二个朝鲜”出现了?俄罗斯正在养虎为患,真正慌的是巴基斯坦

“第二个朝鲜”出现了?俄罗斯正在养虎为患,真正慌的是巴基斯坦

明天见灌装冰块
2026-06-04 02:19:16
乌克兰相关人士表示,通过军事手段恢复乌克兰1991年边界是可能的

乌克兰相关人士表示,通过军事手段恢复乌克兰1991年边界是可能的

山河路口
2026-06-03 14:26:05
抗癌博主获张雪邀请将出国观赛,当事人:不想被过度包装,给张雪带来不好影响

抗癌博主获张雪邀请将出国观赛,当事人:不想被过度包装,给张雪带来不好影响

潇湘晨报
2026-06-03 16:33:17
英媒曝光俄绝密文件:若俄跟北约开战,普京先打中国的2个邻国

英媒曝光俄绝密文件:若俄跟北约开战,普京先打中国的2个邻国

而长终
2026-06-03 01:21:16
“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

妍妍教育日记
2026-05-29 07:55:13
长不长寿,看心率就知道?医生:过50岁,心率别超这个数!别忽视

长不长寿,看心率就知道?医生:过50岁,心率别超这个数!别忽视

今日养生之道
2026-06-04 02:24:54
安徽恶婆婆后续:儿媳后悔,找邻居说和,娘家全体出动求原谅晚了

安徽恶婆婆后续:儿媳后悔,找邻居说和,娘家全体出动求原谅晚了

米果说识
2026-05-31 16:45:27
泰王苏提达出席48岁庆生仪式,王后穿亮紫泰装好旺,玛哈却好疲倦

泰王苏提达出席48岁庆生仪式,王后穿亮紫泰装好旺,玛哈却好疲倦

TVB的四小花
2026-06-04 02:15:19
2026-06-04 09:24:49
AI深度研究员 incentive-icons
AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
453文章数 171关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

215票对208票 美众议院要求特朗普停止动武并撤军

头条要闻

215票对208票 美众议院要求特朗普停止动武并撤军

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

SpaceX发行价135美元 6月12日上市交易

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

教育
时尚
艺术
数码
军事航空

教育要闻

中外合作办学,有个怪事!

粗腿宽肩,正在成为中女审美新风向

艺术要闻

蒋中正44岁手令首曝光!字迹一般,看清才懂书法三千年只追真善美

数码要闻

郭明錤称苹果AR眼镜将取代Vision Pro 带屏版2029年问世

军事要闻

特朗普:若有美军士兵战死 将考虑终止与同伊朗停火

无障碍浏览 进入关怀版