网易首页 > 网易号 > 正文 申请入驻

AI智能体时代:软件工具亟需根本性重新设计

0
分享至


当前的软件工具——从编译器到生产力应用程序——需要进行根本性的重新设计,以跟上以机器速度工作的人工智能智能体的步伐,Google和英伟达的首席科学家表示。

在最近于圣何塞举行的英伟达GTC 2026会议上,Google首席科学家Jeff Dean指出,虽然人类开发人员很少会为C编译器的启动时间感到困扰,但在智能体运行速度远超人类的世界中,传统工具将导致巨大的性能延迟。

Dean表示,编程工具已经在经历这种转变,商业应用程序也必须跟上。这将使智能体能够操作电子表格和文档以程序化方式提取信息。在与英伟达首席科学家Bill Dally就推进AI下一个前沿的广泛对话中,他解释了这一观点。

这次讨论为Google和英伟达的发展路线图提供了珍贵的洞察,展示了从提示-等待式AI向具备自我纠正、谈判甚至设计自己后继者能力的智能体系统的进步。

自主研发

对于Google来说,推进AI的下一个前沿意味着赋能模型作为自主的研发实验室。

当Dally询问Dean行业距离能够实验、整理数据并训练下一版本自己的AI模型还有多远时,虽然Dean承认这种能力"还不完全成熟",但他指出了神经架构搜索的出现,这允许用户自动化神经网络的设计。

"你可以用自然语言指定研究空间,比如'请探索有趣的新蒸馏算法,并尝试使用我们目前没有使用的信息',"Dean说。"它会去执行这些实验。这基本上是研究和生产力的超强力倍增器。"

实现这一目标需要模型突破训练限制。模型不是一次性在整个互联网数据上进行预训练,而是可以在某些环境中采取行动或预测答案,然后再回到学习状态,这将显著提高学习效率,Dean补充道。

光速推理

随着推理预计将占据大部分AI工作负载,英伟达正在积极针对通信延迟进行优化,以赋予AI智能体无需暂停就能"思考"的能力。

"当你深入到曲线的右侧,真正针对延迟进行优化时,事实证明大部分延迟都来自通信,"Dally说。"在英伟达,我们总是提到光速。"

为了减少对数字信号处理和错误纠正的需求,Dally透露英伟达正在试验简化的路由器架构,牺牲带宽——从每秒400千兆比特降至200千兆比特——以换取延迟改善。目标是将路由器延迟降至50纳秒以下。

"通过这样做,我可以看到我们以每秒1万到2万个Token的速度运行相对较大的模型,"他说。

不要移动数据

由于AI消耗大量能源,Dally提供了一个直接的解决方案来减少能源消耗:"不要移动数据。人们在笑,但我是认真的。这绝对是你必须要做的。"

Dally解释说,对低精度NVFP4操作进行乘加计算只消耗10飞焦耳的能量。然而,从外部内存拉取必要数据消耗的能量大约是这个数量的1000倍。

为了解决这个问题,英伟达正在探索先进的3D堆叠技术,物理融合内存和计算。"读取DRAM使用的大部分能量实际上不是读取DRAM本身——而是将比特从读取DRAM的位置移动到GPU引脚所在的位置,"Dally说。

"通过将DRAM直接堆叠在执行计算的GPU之上,我们可以获得一个数量级更多的带宽,同时每比特消耗更少的能量。这最终是相同的功率,但性能要高得多。"

除了硬件创新,驯服AI功耗危机还需要算法效率的大幅改进。"如果你能以更少的工作获得相同的精度,这也会减少能源消耗,"他补充道。

Dally强调了稀疏性——跳过对模型最终输出影响不大的数学参数计算的技术——作为功耗降低的巨大机会。英伟达在其Ampere架构中引入了二比一结构化稀疏性,当前的混合专家模型使用粗粒度稀疏性形式来节省计算。

然而,Dally警告说,追求更高级别的稀疏性会破坏使GPU如此高效的高度规则、可预测的计算模式。"当你破坏这种模式时,你需要更多的控制和数据路由来处理不规则性,"他说。

AI构建自己的基础设施

这种智能体的未来已经在英伟达和Google自己的工程团队中成型,AI正在设计下一代芯片。

Dean指出了Google在芯片设计中使用AI进行布局和布线的成功——引用其备受赞誉的AlphaChip研究——而Dally详细阐述了英伟达在其设计管道中使用AI的情况。

英伟达最成功的内部工具之一是NVCell,这是一个强化学习程序。每次公司转向新的半导体工艺时,工程师必须移植多达3000个单元的标准单元库。

"过去需要8人团队花费约10个月,"Dally说。"我们开发了一个基于强化学习的程序,结果实际上比人类设计更好。"

除了物理芯片布局,英伟达还部署了一个名为ChipNeMo的定制大语言模型来提升工程生产力。

ChipNeMo在英伟达专有硬件设计文档上训练,作为初级工程师的导师,节省了资深设计师解释特定芯片组件基本功能的时间。它还可以总结错误报告并自动将其路由到合适的设计师进行解决。

Dally希望AI最终能够自动化芯片开发中最耗时的部分。"我很希望能够简单地说,'给我设计一个新的GPU',然后我去滑雪几天,回来时就完成了,"他说,尽管他承认距离那个现实还很遥远。

即使那一天到来,Dally预期AI芯片设计师也会依赖一个主智能体来编排专门的子智能体,这些智能体相互协商来确定架构,复制人类工程师今天举行的会议。

Q&A

Q1:为什么传统软件工具无法适应AI智能体的工作速度?

A:因为AI智能体运行速度远超人类,而传统工具如编译器、生产力应用程序的启动时间和响应延迟对人类来说不是问题,但会在智能体高速操作时造成巨大的性能瓶颈。因此需要根本性重新设计来匹配机器速度。

Q2:AI模型如何实现自主研发能力?

A:通过神经架构搜索技术,模型可以用自然语言指定研究空间,自动进行实验、整理数据并训练下一版本。模型需要突破传统训练限制,在环境中采取行动或预测答案后再回到学习状态,显著提高学习效率。

Q3:英伟达如何解决AI计算中的能耗问题?

A:主要策略是"不要移动数据",因为数据移动消耗的能量是计算本身的1000倍。英伟达通过3D堆叠技术将内存直接堆叠在GPU之上,减少数据移动距离,同时探索稀疏性技术跳过不重要的计算来降低能耗。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
香港偶遇46岁容祖儿 弯腰驼背走路肚子只剩一张皮 鞋跟高都有20cm

香港偶遇46岁容祖儿 弯腰驼背走路肚子只剩一张皮 鞋跟高都有20cm

科学发掘
2026-06-01 06:03:49
小米、鸿蒙智行、小鹏、蔚来等,5月份交付量盘点

小米、鸿蒙智行、小鹏、蔚来等,5月份交付量盘点

科技锋说
2026-06-01 13:38:17
年轻人想去纪委工作,要三思而行!

年轻人想去纪委工作,要三思而行!

一口娱乐
2026-05-30 19:36:20
多车企公布5月份成绩单:鸿蒙智行交付46122台,蔚来公司交付37705台,极氪交付34377辆,小米交付超30000台

多车企公布5月份成绩单:鸿蒙智行交付46122台,蔚来公司交付37705台,极氪交付34377辆,小米交付超30000台

中新经纬
2026-06-01 12:37:11
女生对性渴望属于正常现象吗?

女生对性渴望属于正常现象吗?

宇宙时空
2026-05-31 14:35:09
午评:沪指跌0.12% 煤炭板块、AI应用概念大涨

午评:沪指跌0.12% 煤炭板块、AI应用概念大涨

证券时报
2026-06-01 11:54:02
中韩半导体ETF等多只爆款基金,将停牌1小时!近50%美股QDII停购或限购

中韩半导体ETF等多只爆款基金,将停牌1小时!近50%美股QDII停购或限购

新浪财经
2026-05-31 22:15:03
蔚来五月交付破3.7万台创历史新高

蔚来五月交付破3.7万台创历史新高

盖世汽车
2026-06-01 12:42:05
“张雪机车”阿拉贡站第一、二回合正赛均获第8名,张雪发文:德比斯把问题都揽到自己身上是不对的,将直面短板快进改进

“张雪机车”阿拉贡站第一、二回合正赛均获第8名,张雪发文:德比斯把问题都揽到自己身上是不对的,将直面短板快进改进

海峡网
2026-06-01 09:29:55
伊朗把浓缩铀“快递”到中国,特朗普气得拍桌:这招太阴了!

伊朗把浓缩铀“快递”到中国,特朗普气得拍桌:这招太阴了!

浪子的烟火人间
2026-05-30 10:12:09
爬长城偶遇胡歌,真人不仅又高又帅还特别有少年感,笑容十分治愈

爬长城偶遇胡歌,真人不仅又高又帅还特别有少年感,笑容十分治愈

乡野小珥
2026-05-29 10:24:54
为了赖掉周星驰8000万,他们亲手葬送了900亿的影视帝国。

为了赖掉周星驰8000万,他们亲手葬送了900亿的影视帝国。

流苏晚晴
2026-05-27 18:41:20
老杜家族开始行动,没收小马科斯“主导权”,菲律宾大风暴逼近

老杜家族开始行动,没收小马科斯“主导权”,菲律宾大风暴逼近

世界有奇事
2026-06-01 13:40:43
罗马尼亚遭袭后,梅德韦杰夫警告:欧盟已进入与俄罗斯的战争

罗马尼亚遭袭后,梅德韦杰夫警告:欧盟已进入与俄罗斯的战争

澎湃新闻
2026-05-31 11:04:28
直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

锅锅爱历史
2026-05-31 17:22:37
直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

古史青云啊
2026-06-01 14:42:55
再创历史新高!零跑汽车5月全系车型交付量达81569台

再创历史新高!零跑汽车5月全系车型交付量达81569台

CNMO科技
2026-06-01 14:34:04
史上最和谐的皇室兄弟:哥哥将皇位让给弟弟,弟弟追封哥哥为皇帝

史上最和谐的皇室兄弟:哥哥将皇位让给弟弟,弟弟追封哥哥为皇帝

鹤羽说个事
2026-05-30 23:07:30
新闻联播都快"看不懂"了,近年出现了越来越多专业的新词汇

新闻联播都快"看不懂"了,近年出现了越来越多专业的新词汇

飘逸的云朵
2026-05-30 03:39:47
痛心!山西秦秀宇老师心梗去世,年仅39岁,自称60岁正是闯的年纪

痛心!山西秦秀宇老师心梗去世,年仅39岁,自称60岁正是闯的年纪

小鋭有话说
2026-06-01 12:09:23
2026-06-01 15:52:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18906文章数 49707关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

天涯社区重启 推出1999元"新天涯创世成员产品服务包"

头条要闻

天涯社区重启 推出1999元"新天涯创世成员产品服务包"

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

教育
数码
本地
公开课
军事航空

教育要闻

三年级数学,竖式谜,你有思路吗?

数码要闻

RTX Spark处理器亮相:英伟达把数据中心搬上了书桌

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

韩国最大军工企业爆炸 已造成5人死亡

无障碍浏览 进入关怀版