对苹果的AI来说,
庞若鸣大神举足轻重。
他在谷歌工作十余年后,
于2021年加入苹果,
领导Apple Intelligence团队。
他既懂炼丹又懂建炉,
以设计紧凑、高性能的模型而闻名,
既然模型能在硬件上跑,
那就无需依赖云端,
从而让苹果在移动和隐私保护方面更具优势。
他离职是公司损失。
苹果的AI战略依然谨慎,
但是借力于封闭式的打法,
其硬件生态系统护城河相当之深,
随后,苹果重组AI团队,
又给阿里千问等模型机会,
据阿里千问小哥哥向我提及,
过程中他对苹果公司对隐私的重视极其钦佩。
但这一切,都是对Siri当下局限性的默认。
再看Meta,
LLaMA模型在2025年彻底落伍。
而扎克伯格押注天才。
于是,为了说服庞,
一笔总额超过2亿美元的资金,
分几年支付。
假如庞若鸣是Meta AI Infra一号位,
离职说明什么?
信息量不大,推测必须克制。
而他离职前在干什么,
却能从论文中略窥,
《RLAX:面向TPU上大型语言模型的大规模分布式强化学习》2026年2月7日。
他主导TPU方向探索。
Meta有没有用谷歌的TPU,
此事一直很谜,
又是半导体热门话题,
先从一个事实出发:
Meta和Google上市公司,
有两个基本约束:
1.重大资本支出必须披露。
2.影响股价的重要事项不能选择性隐瞒。
Meta是否采购谷歌TPU,
没有公开财报。
若大规模采购,会发生什么?
第一,这是巨额资本支出。
会体现在资本开支中
分析师在财报电话会上一定会问:
英伟达GPU还买吗?
解绑单一芯片供应商,这是好消息。
再看谷歌,卖了TPU,
收入增加业绩亮点,
单独看庞若鸣离职,不足以说明硬件战略变化。
他至少部分主导TPU方向探索。
Meta可能:
1.在评估TPU做强化学习的可行性
2.对比成本
3.研究TPU在强化学习上的效率优势
这是正常infra战略评估行为,不等于大迁移。
用了多少卡呢?1024 v5pTPUs。
这不是超大规模长期集群。
而是"Preemptible"
也就说,
庞若鸣团队做实验的,
不是自建集群,而是云租用。
而不是,采购TPU建长期基础设施。
好玩的来了,
论文看不了了。
原因是:
“由于内部利益相关者认为,
目前不宜发表有关此主题的研究成果,
撤回投稿。”
好了,克制下的结论是:
Meta仍在认真评估TPU的可行性。
![]()
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.