网易首页 > 网易号 > 正文 申请入驻

《华尔街日报》:无论我们怎么怀疑,AI模型的能力真的在飞速提升

0
分享至

(关注公众号设为标,获取AI深度洞察)

全文 3,000字 | 阅读约13分钟

作者:Kevin Roose

从2025年开始,才三个月时间,DeepSeek的R1,Grok 3, Claude 3.7 Sonnet, GPT-4.5等先进AI模型相继推出,AI展现了惊人的技术进步速度。

在过去几年里,AI 在多个领域开始超越人类,比如数学、编程和医学诊断等,且它们的能力正日益提升。

或许在 2026 或 2027 年,也可能更早——甚至是今年——就会有 AI 公司宣布他们已经创造出 AGI,即一种能够完成几乎所有人类认知任务的通用型 AI。 届时,关于 AGI 的定义争议以及是否真正达到了 AGI 水准的讨论将不可避免。但这些争论并不重要,真正关键的是,我们正失去对人类级智能的垄断,一个拥有超强 AI 的世界正在到来。

在未来十年里,AI 将创造数万亿美元的经济价值,并改变全球政治和军事格局,掌控这一技术的国家将占据主导地位。各国政府和大型企业对此已有共识,并投入了巨额资金争夺领先地位。

然而,大多数人和机构对现有 AI 的冲击仍毫无准备,更遑论未来更强大的系统。而各国政府也缺乏切实可行的应对方案,既无法有效规避风险,也未能充分利用 AI 带来的机遇。

与此同时,坚决否定 AI 进展的怀疑论者仍在断言 AGI 只是幻想。但他们不仅低估了 AI 的发展速度,还误导公众,让人们对即将到来的变化掉以轻心。 无论你认为 AGI 是人类的福音还是潜在威胁,现在仍难下定论。但可以确定的是,它的到来将引发一系列重大经济、政治和技术问题,而目前,我们仍没有答案。

这些想法听上去或许有些危言耸听。但我并不是一个沉迷科幻的未来主义者,也不是一个炒作 AI 投资的商人,更不是看了太多《终结者 2》后陷入狂想的人。

我是一个记者,花了大量时间与那些构建最先进 AI 系统的工程师、支持这项技术的投资人以及研究其影响的专家交流。而从这些人的言谈中,我逐渐意识到,AI 领域正在发生的变革,远比大多数人想象的更深远。 在 旧金山,AGI 早已不是什么边缘概念。这里的人们谈论"感受到 AGI",而打造超越人类智慧的 AI 已成为 硅谷 一些巨头的明确目标。每周,我都会遇到 AI 领域的工程师和创业者,他们的共识是——变革即将到来,而且规模空前,可能彻底改变世界。

过去一两年间,曾经被认为是'短期预测'的观点(即 AGI 可能会在本十年内实现),如今已经接近成为行业共识。"去年从 OpenAI 离职的独立 AI 政策研究员 Miles Brundage 最近告诉我。

在旧金山湾区之外,大多数人对 AGI 仍然闻所未闻,更谈不上为它的到来做准备。而在新闻行业,认真对待 AI 进展的记者,仍然可能被嘲讽为过度轻信或是为科技公司摇旗呐喊的'吹捧者'"。

坦白说,我能理解这种反应。尽管 AI 已经助力诺贝尔奖级别的科研突破,尽管每周有 4 亿 人在使用 ChatGPT,但现实中,大多数人日常接触到的 AI 仍然让人不耐烦。我能理解那些在 Facebook 上看到满屏 AI 生成垃圾内容,或是被笨拙的客服机器人折腾得焦头烂额的人,他们可能会嘲笑:"就这?还要统治世界?"

我曾经也持怀疑态度,但现在,我不得不承认自己看走了眼。有几件事让我开始重新审视 AI 的发展,并认真对待它的未来影响。

二、行业内部的警钟已敲响

如今 AI 产业中最令人不安的一点是,最了解这项技术的人——领先 AI 公司的工程师和高管们——往往也是对其发展速度最为担忧的一群人。

这种情况并不常见。回到 2010 年,我曾报道社交媒体的崛起。当时,Twitter、Foursquare 和 Pinterest 的内部人士并不会警告他们的产品可能引发社会动荡。Mark Zuckerberg 也不会测试 Facebook,试图找出它是否能被用于制造生物武器或发动网络攻击。

但如今,那些真正掌握 AI 进展信息的人——那些正在打造最先进 AI 系统、能接触到公众尚未见过的技术的工程师——却在警告我们,重大变革近在眼前。领先的 AI 公司已经开始为 AGI 做准备,并在研究其潜在风险,比如它们是否具备欺骗能力,是否会变得更加自主,甚至具备策划复杂计划的能力。

OpenAI 首席执行官 Sam Altman 曾表示:"开始指向 AGI 的系统已经进入视野。"

Google DeepMind 首席执行官 Demis Hassabis 认为,AGI 可能还需要三到五年才能实现。

Anthropic 首席执行官 Dario Amodei(尽管不喜欢 AGI 这一术语,但基本认同其核心概念)上个月告诉我,他认为我们距离"在几乎所有领域都比人类更聪明的 AI" 仅剩一到两年。

或许我们应该对这些预测持保留态度。毕竟,AI 公司的高管可能会因市场炒作而夸大 AGI 进展,以获取更多投资或更高估值。

但许多独立专家——包括 AI 领域的开拓者 Geoffrey Hinton 和 Yoshua Bengio,以及 拜登政府 前 AI 顾问 Ben Buchanan——也持相同看法。此外,许多经济学家、数学家和国家安全领域的专家也在发出类似警告。

当然,并非所有专家都认同 AGI 即将到来。但即使忽略所有 AI 公司的人员,或那些在行业中有既得利益的人,依然有大量独立且权威的声音在发出警示,而这些声音,不容忽视。

在我看来,与专家的预测同样重要的,是 AI 近期的实际进展——对于任何经常使用它的人来说,这些改进都是显而易见的。

回顾 2022 年,当 OpenAI 推出 ChatGPT 时,即便是最先进的 AI 模型仍然会在简单的算术题上犯错,面对复杂推理问题时频频失败,甚至会凭空捏造事实,产生"幻觉"。当时的聊天机器人在特定场景下可以令人惊叹,但远远达不到可以承担关键任务的程度。

而现在,AI 的进步已不可同日而语。专门化模型在 国际数学奥林匹克竞赛(IMO)上达到了奖牌级水平,而通用模型的推理能力已经强大到需要开发更复杂的测试来衡量其能力。虽然 AI 仍然会犯错,但最新模型的幻觉现象已大幅减少。许多企业如今也已将 AI 融入核心业务,直接面向客户提供服务。

这种进步的部分原因在于 AI 模型规模的不断扩大。更庞大的模型、更丰富的数据、更强大的计算资源,通常能带来更优质的性能,而如今的领先模型相比早期版本已经大幅增长。

但这并非唯一因素。近年来,AI 研究在技术层面也取得了重要突破,尤其是"推理"模型的出现。这类模型会在给出答案前进行额外的思考步骤,以提高逻辑推理能力。

例如,OpenAI 的 o1 和 DeepSeek 的 R1 采用了强化学习技术——这一方法曾让 AI 在围棋比赛中超越人类。它们如今能够解决许多以往令模型束手无策的问题。GPT-4o 在 2024 年的 AIME(美国数学邀请赛)上仅得 9%,而几个月后发布的推理模型 o1 在同一测试中的得分高达 74%,展现出惊人的能力飞跃。

这些技术进步使 AI 在白领知识型工作中的应用价值日益凸显。我的同事 Ezra Klein 最近写道,ChatGPT 的高级功能 Deep Research 能够生成深度分析报告,其质量"至少相当于他共事过的研究员的平均水平"。

我自己也发现,AI 工具在工作中的用途越来越广泛。我不会用 AI 直接撰写文章,但它已经成为我的得力助手——帮助我准备采访、总结研究论文,甚至开发个性化应用来处理行政事务。几年前,这些功能几乎难以想象。而且,我很难相信任何认真使用 AI 进行工作的用户会认为它的进步已经停滞。

如果你想真正理解 AI 的进步速度,不妨去问问程序员。一两年前,AI 编码工具的主要作用是提升程序员的工作效率,而不是取代他们。但今天,越来越多的软件工程师告诉我,AI 已经承担了大部分实际编码工作,而他们的角色正逐渐变成 AI 的监督者。

Y Combinator(YC)合伙人 Jared Friedman 近日透露,在 YC 目前孵化的初创公司中,约四分之一几乎完全依赖 AI 编写代码。"如果是一年前,他们还需要从零开始开发产品,"他说,"但现在,95% 的代码都是由 AI 生成的。"

四、未雨绸缪,胜于措手不及

作为一种谨慎的认知态度,我必须承认,我和许多人的预测可能是错误的。 或许 AI 的发展会遇到难以预料的瓶颈——比如能源短缺,使得企业无法建设更大规模的数据中心,或者高性能芯片供应受限,阻碍模型训练。也可能是当前的技术架构和训练方法尚不足以实现 AGI,我们仍需进一步的重大突破。 但即便 AGI 的到来比预期晚十年——比如 2036 年而非 2026 年——我们仍然应该从现在开始做好准备。

实际上,大多数为 AGI 做准备的建议,本质上都是我们本来就该做的事情:升级能源基础设施、强化网络安全、加快 AI 生成药物的审批流程、制定防范 AI 风险的监管规则、在学校推广 AI 素养教育,并将培养重点从即将被淘汰的技术技能转向社会和情感发展。这些举措即便与 AGI 无关,也值得推行。 一些科技界人士担心,过早的恐慌可能会导致 AI 监管过度,扼杀创新。但 特朗普政府 已表态希望加速 AI 发展,而非放慢脚步。同时,各大 AI 公司正投入数千亿美元研发新一代模型,且资金流入仍在加速,因此,这些企业主动踩刹车的可能性微乎其微。

相比过度准备,我更担心的是,许多人在 AI 真正影响他们的生活之前,根本不会意识到它的威力——等到 AI 取代他们的工作、让他们陷入骗局,或直接影响他们的安全时,才会后知后觉。这与社交媒体的崛起如出一辙。Facebook 和 Twitter 早期并未被视为威胁,等到它们对社会产生深远影响,我们才发现监管为时已晚。

这正是为什么,我认为我们应该从现在开始认真对待 AGI,即便它的确切到来时间和具体形式仍然未知。

如果我们选择无视它,或者只是心存侥幸,就可能错失主动塑造这项技术的关键机会——而一旦错失,后果将难以逆转。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:https://www.nytimes.com/2025/03/14/technology/why-im-feeling-the-agi.html

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

吕醿极限手工
2025-12-29 18:33:00
2天夺3金!冬奥会奖牌榜大乱:中国队升7位冲亚洲第一 剩3个夺金

2天夺3金!冬奥会奖牌榜大乱:中国队升7位冲亚洲第一 剩3个夺金

越岭寻踪
2026-02-20 06:32:49
从星链落地到全面改革,被低估的越南正在惊人“逆袭”

从星链落地到全面改革,被低估的越南正在惊人“逆袭”

凤眼论
2026-02-19 09:08:18
马斯克称星舰每年将发射超过1万颗卫星

马斯克称星舰每年将发射超过1万颗卫星

财联社
2026-02-21 07:38:06
法国艺术圈地震!芭蕾女神、哲学少女,都被钢琴家送给了爱泼斯坦!

法国艺术圈地震!芭蕾女神、哲学少女,都被钢琴家送给了爱泼斯坦!

新欧洲
2026-02-18 19:44:34
以一己之力负债2.4万亿,许家印靠山是谁?说出来你可能不信

以一己之力负债2.4万亿,许家印靠山是谁?说出来你可能不信

历史伟人录
2025-11-28 13:58:56
利雅得胜利跌至第3,托尼23球领跑射手榜,C罗的金靴也保不住了?

利雅得胜利跌至第3,托尼23球领跑射手榜,C罗的金靴也保不住了?

夏侯看英超
2026-02-21 02:25:17
日本福冈发生持刀杀人未遂事件,中领馆再发提醒

日本福冈发生持刀杀人未遂事件,中领馆再发提醒

界面新闻
2026-02-20 13:06:23
《惊蛰无声》正在热映,演员评分出炉:宋佳4.7分垫底,杨幂仅第3

《惊蛰无声》正在热映,演员评分出炉:宋佳4.7分垫底,杨幂仅第3

乡野小珥
2026-02-21 05:23:45
中国终止越南核电站合作,十年投入成泡影,日本计划落空

中国终止越南核电站合作,十年投入成泡影,日本计划落空

聚焦真实瞬间
2026-01-21 08:04:16
湖南消防车坠崖后:目击者曝细节 遇难家属发声,车厢有水成致命点

湖南消防车坠崖后:目击者曝细节 遇难家属发声,车厢有水成致命点

奇葩游戏酱
2026-02-21 00:37:43
再赢坂本花织,刘美贤完美表现逆转,赛后爆粗真情流露引热议

再赢坂本花织,刘美贤完美表现逆转,赛后爆粗真情流露引热议

体育妞世界
2026-02-20 12:40:08
倪萍:父亲到死我都没喊他一声“爸”,母亲的仇恨教育刻骨铭心

倪萍:父亲到死我都没喊他一声“爸”,母亲的仇恨教育刻骨铭心

白面书誏
2025-11-22 17:18:59
真要交手了?亚马尔曾在采访中表示如果遇到中国队也会很困难

真要交手了?亚马尔曾在采访中表示如果遇到中国队也会很困难

懂球帝
2026-02-20 14:23:05
没想到吧?徐梦桃王心迪式的奥运金牌夫妻并不罕见,中国共有7对

没想到吧?徐梦桃王心迪式的奥运金牌夫妻并不罕见,中国共有7对

真理是我亲戚
2026-02-20 23:05:16
德媒披露北溪管道爆炸内幕

德媒披露北溪管道爆炸内幕

参考消息
2026-02-20 12:59:05
老外抢疯了?国产“青春舱”海外订单飙升367%,业内:中国方案可靠

老外抢疯了?国产“青春舱”海外订单飙升367%,业内:中国方案可靠

刘旷
2026-02-21 08:30:33
比胡歌帅,比靳东火,42岁未婚未育的他,现在如何了?

比胡歌帅,比靳东火,42岁未婚未育的他,现在如何了?

以茶带书
2026-02-20 23:06:28
超30亿元!有沈腾就能赢?

超30亿元!有沈腾就能赢?

中国新闻周刊
2026-02-20 18:34:56
决赛失误无缘卫冕!齐广璞泪崩:这是我最后一届,可以放心离开了

决赛失误无缘卫冕!齐广璞泪崩:这是我最后一届,可以放心离开了

奥拜尔
2026-02-20 23:51:16
2026-02-21 09:23:00
AI深度研究员 incentive-icons
AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
390文章数 159关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

被问征收的约1750亿美元关税是否需要退还 特朗普表态

头条要闻

被问征收的约1750亿美元关税是否需要退还 特朗普表态

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

特朗普全球关税被推翻!有何影响?

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

家居
数码
本地
手机
教育

家居要闻

本真栖居 爱暖伴流年

数码要闻

苹果macOS 26.3代码曝光平价MacBook和新显示器

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

手机要闻

谷歌Gemini 3.1 Pro发布,更智能

教育要闻

为什么说要学好英语

无障碍浏览 进入关怀版