去年这个时候,大模型还在云端抢显卡。现在谷歌说,能在你手机里跑一个比GPT-3还大的模型——而且不烫手。
这相当于把一台服务器折成纸飞机,塞进牛仔裤口袋。
5月20日I/O大会,谷歌甩出三颗炸弹:Gemini Nano 2、Veo 3视频生成、第六代TPU。最狠的是那个数字:1400亿参数,端侧运行。参数规模比GPT-3(1750亿)略小,但GPT-3当年需要数据中心级别的算力,现在谷歌说手机就行。
参数不是全部。谷歌工程师在演示里放了一段对比:同一部Pixel,跑上一代Nano时生成回复要3秒,Nano 2只要0.8秒。延迟砍了七成,功耗反而降了40%。
「我们重新设计了注意力机制,」Gemini团队负责人Sissie Hsiao在后台采访时说,「以前模型像图书馆管理员,每查一本书都要跑遍全馆。现在我们把常借的书放在手边。」
云端派 vs 端侧派:一场被低估的路线之争
OpenAI和谷歌的裂痕,早就不只是产品竞争。
ChatGPT的模式是重云端、轻终端。你的提问先飞到美国某个数据中心,算完再飞回来。好处是模型可以无限大,坏处是——没网就傻眼,延迟看缘分,隐私全裸奔。
谷歌选的是另一条路。从2023年推出Nano开始,它就赌端侧智能。当时业内普遍看衰:手机那点算力,能跑什么正经模型?
两年后的答案很粗暴。Nano 2的1400亿参数,比初代Nano(32亿)膨胀了43倍。作为参照,Meta的Llama 3 70B已经被业界视为「大模型上端」的标杆,谷歌直接翻倍再拐弯。
更隐蔽的杀招在架构层。谷歌把模型切成碎片,按需加载——不是一次性塞进内存,而是像流媒体一样,用哪块调哪块。配合自研的第六代TPU,推理效率比上一代提升4.7倍。
「这不是简单的优化,是重新发明轮子,」Google DeepMind CEO Demis Hassabis在发布会后的技术圆桌上说,「我们要让AI像水电一样无处不在,但不需要建发电厂。」
Veo 3的8秒:视频生成进入「可用」临界点
如果说Nano 2是闷声发财,Veo 3就是 loud and clear。
谷歌放出的演示视频里,一段8秒的东京雨夜镜头,车灯在湿漉漉的路面拖出光轨,行人撑伞走过,雨滴砸在水洼里的涟漪清晰可见。没有闪烁,没有畸形手指,没有突然融化的建筑。
8秒,1080p,原生音频同步生成。这意味着AI终于能处理「雨声」和「画面」的时序关系——不是后期配音,是理解物理世界。
对比很残酷。OpenAI的Sora至今仍是期货,用户能摸到的版本最长6秒,720p,静音。Runway的Gen-3支持10秒,但人物一致性还是抽奖。
谷歌的解法叫「流式扩散」。传统视频生成是一口气画完24帧,Veo 3改成一帧一帧流式输出,每帧参考前帧的物理状态。代价是计算量暴增,但谷歌有TPU集群兜底。
「我们内部测试时,让Veo 3生成一段『玻璃杯从桌上滑落』,」一位参与项目的研究员透露,「它真的画出了玻璃碎裂的裂纹走向,以及碎片飞溅的抛物线。这不是记忆,是模拟。」
该研究员要求匿名,因未获授权对外发言。
第六代TPU:谷歌的「算力关税」
所有模型的底气,最后都落在芯片上。
第六代TPU Trillium,谷歌没有公布具体晶体管数量,但给了两个关键数字:训练效率比上一代提升4倍,推理成本降低67%。
这直接改写了商业模型。以Gemini 1.5 Pro的百万token上下文为例,去年调用成本让中小企业肉疼,现在谷歌宣布API价格腰斩再拐弯。
更深远的影响在供应链。英伟达H100的缺货危机,让全球AI公司学会了一件事:算力自主就是生存自主。谷歌从2016年开始自研TPU,当时被嘲讽为「搜索公司的 vanity project」,现在成了护城河。
「我们不做芯片是为了卖芯片,」谷歌云CEO Thomas Kurian在分析师电话会上说,「我们是为了让模型更便宜、更快、更隐私。如果这顺便让英伟达不舒服,那是副作用。」
这话的潜台词:谷歌正在建立「算力-模型-应用」的垂直闭环。苹果有芯片和系统但缺模型,OpenAI有模型但缺芯片和终端,Meta两头都缺只能开源换生态。谷歌是唯一凑齐三件套的玩家。
当然,代价是生态封闭。TPU只服务谷歌云,Nano 2只首发Pixel。这种「苹果式傲慢」在Android阵营能走多远,是另一个问题。
一个细节:I/O现场演示Nano 2时,演示机全程飞行模式。谷歌想强调的显而易见——没有云端,AI照样转。但台下有工程师注意到,演示机的温度传感器读数被刻意遮挡了。1400亿参数在本地燃烧,手机到底烫不烫?谷歌没给答案。
如果端侧智能真的成熟,下一个被颠覆的会是谁?不是OpenAI,是那些靠API调用费活着的中间层公司。当模型住进手机,「AI应用」这个词本身可能就要重写。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.