网易首页 > 网易号 > 正文 申请入驻

【中美AI核心笔记】有点晚了,但还想再谈谈2025

0
分享至




从生成,到推理

从大模型时代,到大智能体时代

Scaling Law 的另一种范式…


有点晚了,但还是想回顾一下 2025。

如题,2025 ,我们站在 1/4 世纪的交界处。

这是一个「硅谷大年」:科技巨头继续搅动世界,但 Deepseek、Manus、Qwen、K2 等中国 AI 力量,也开始赢得世界认可,生出一股华人春风。

这也是中国「十四五」收官与「十五五」的衔接之年:「人工智能 + 行动」中,一系列新的风向与趋势暗流涌动。

技术上,2025 ,可能也酝酿着深刻的范式转移。

本文串联了 2025 AI 行业的一些关键时刻,以及 漫谈Light the Star 所收集的不同行业视角,取材自近 30 位中美 AI 创业浪潮中关键人物的对话,其中包含 AI 创业者、投资人、生态建设者与观察者,试图记录 2025 中美 AI 跃进的轨迹,也埋下 2026 值得关注的伏笔。

(全文共 14866 字,需 30 分钟左右阅读)

(️原版访谈的播客版,可前往小宇宙等平台搜索同名账号《卫诗婕_漫谈Light the Star》)


2025 那个不平凡的春节,Deepseek 和宇树让整个硅谷都意识到,要看工程能力的实力,还得看中国人。

一位在英伟达工作的程序员在查阅 Deepseek R1 的源代码后感慨,「太漂亮了」。

华人数学好,这早已成为共识。但在 AI 时代,另一个让华人撑起大模型主力军的重要原因则是,「硅谷早年都是华人在做 Infra,Infra 很苦,白人不愿意干。但 Infra 对大模型来说,又刚好很关键。」

这些拥有超强工程能力、聪明勤奋,且见识过现象级增长的华人,成了 AI 战局中的香饽饽。

Deepseek 的出现,进一步点燃了某种对华人的期待:美国自 2022 年开始对华实施全面的算力卡脖子,中国 AI 市场上,创业公司们至今只能使用一些芯片水货。即便如此,中国人还是做出了 Deepseek R1 ——以更少算力、更高的效率做出了能够媲美 GPT-4o 的大模型。

美国政界和科技界也因此出现两派分歧的声音:一派认为,Deeepseek 的出现,宣告着过往的算力卡脖子无效,不应再以这样的方式「防」下去了。另一派,则以 Anthropic 的 CEO Dario 的发声为代表,一种「对华加强管制论」正在抬头:此前美国对华的算力封锁,不是防的无用,而是防得不够。

很快,「加强管制论」的声音迅速发展——随着川普上台,针对中国 AI 的算力限制升级、投资限制的加强落地,以及 AI 扩散规则,一起将中美科技竞争推向一个新的高潮。


2025 的 Q1,从 Deepseek、宇树到 Manus,整个硅谷都在谈论中国。多名硅谷的美元投资人表示,

「市场上的情绪到了。」

据称,Manus 爆火之后,Benchmark 创始人随即决定来华寻找项目,并在几个月后以 7500 万美元大手笔投资了 Manus 的母公司蝴蝶效应,将后者的估值推高至 5 亿美元。

事实上,顶尖的美元机构一直在通过数据检测中国市场的潜力公司。上述投资人告诉我,A16z 曾主动询问一个位于成都的 AI 项目,后者据称和 OpenAI 有着深度合作。顶尖机构们对华人背景的项目有着浓厚兴趣,毕竟,美国 AI 项目的估值涨得太快了;相较之下,中国 AI 资产显得划算无比。

一个背景是:在这一轮 AI 浪潮故事的开始,美国 VC 几乎集体错过了大模型,「底层基模几乎是巨头大厂之间的游戏,VC 根本没机会参与;」就在 2024 年底,许多人还对基础模型的未来持有怀疑甚至略显悲观。但时间来到 2025 年初,Deepseek 和 Qwen 这两个来自中国的成熟模型, 一举将 AI 推入普惠的推理时代——开源的 Deepseek 和 Qwen 把使用大模型的成本打了下来,而 Manus 则演绎了套壳、产品定义和工程创新的力量。

AI 的应用时代正式到来。美元 VC 们又活跃起来。

一位硅谷的美元投资人这样评价 Manus 的「里程碑效应」:尽管 Benchmark 所投资的这 7500 万美元,放在硅谷并不算什么惊人的大数目,「但这却是顶级美元机构创始人亲自投的、针对中国背景的 AI 项目开出的一单 super check。给了无数华人 AI 创业者以无限的想象。」

一家 FA 机构也向我们透露,Q2 开始,许多创始人开始询问,是否最好能够拿到硅谷本土美元的钱?毕竟,那意味着更高的估值、更宽松的投资条款限制……

某种信心被点燃了 。到硅谷去。成为许多 AI 创业者的心声。


客观上,本土美元投资中国 AI 的风险在上升

今年 5 月,Manus 收到美国财政部的问询函——这封问询函的出处,来自于被称为 「Reverse CFIUS(反向投资审查)」的对外投资规则(Outbound Investment Rule),该规则规定,美国资本投资特定行业(半导体、AI、量子计算)的中国公司,符合一定条件的必须进行申报(达到某些条件则被禁止),否则,美国财政部将保留追究权利,严重者将可能被要求撤回投资——简单来说,这项规则的核心,在于限制美国资本投资中国 AI 公司。

值得注意的是,OIR 中,「中国公司」的界定范围被扩大了总部在中国、中国人或中国公司持有大部分股权、控制子公司、财务数据判定等,都有可能被界定为是中国公司——因此,美元基金 Benchmark 此前对 Manus 的 7500 万美元投资,被美国财政部认为,可能存在禁止投资的嫌疑。

事实上,包含 Manus 在内的多笔投资,正遵循 OIR 规则落地并执行。这客观上营造出一种「寒蝉效应」:面对中国背景的 AI 项目,美国本土的美元基金,既兴奋,又谨慎。

「顶级的美元机构早已完成拆分。」上述人士说。例如红杉、GGV 等顶级机构,早已为华设立独立分支,但对于那些从美国基金直接出手的纯美元机构而言,在操作上,选择中国项目的风险则难以忽视

目前,顶级美元机构(如 Benchmark, Sutter Hill, Greylock)正在形成一种默契—— 在微妙的地缘政治面前,「Decoupling of Capital and Talent(实现资本与人才的脱钩)」。具体来说,美元依然热爱着中国背景的顶级工程师、创始人和产品团队,但前提是,这些项目必须在法律架构、数据存储和市场重心上,彻底剥离“中国属性”,成为一家 Day 1 的全球化公司,或是美国公司

「Manus 完成了一场彻底的示范。」上述人士说,他指的是,在 Manus 收到美国财政部的问询函后,裁撤了公司位于武汉的团队,并将总部搬迁至新加坡——「干脆、利落。」事实上,认为 Manus 起到示范作用的人还有很多。今年 10 月,我在硅谷一场科技大会的现场,于在场不同人士的谈话间多次听到关于 Manus 的讨论,其中一位也在硅谷做 AI 创业的华人认为,

「Manus 很好地示范了一家中国公司,如何摇身一变,成为一家美国公司。」

但这不是事实。

事实上,Manus 是开曼架构,且将总部搬去新加坡(而非美国),这并不是要成为一家美国公司的定性。

清律纽约律师事务所合伙人黄敏达在《漫谈》的节目中曾提醒众多创业者:不建议照搬 Manus 的行为、将之视作标准的 AI 创业样本——

  • 选择把总部搬到新加坡——在美国眼中,新加坡已经不是一个绝对信任之地。换言之,将总部搬到新加坡而非美国,可能呈现一种暧昧之姿。

  • 裁撤中国团队——也并不根本上解决问题。

  • 甚至假如创始人们都变更了国籍(只是假如)——这也不是最重要的。

(我们曾在第23、58期播客中,都探讨过中美科技对弈的演进,以及美国立法执法的走向)


「美国人更在乎的是,当有一天中美两地发生不可调和的分歧,这家企业是否会完全站在美国这边,并为美国所控制。」从这个角度看,国籍、总部所在地、运营支出大头所在地——这些重要,但终究不是最重要。黄敏达指出,如果只是根据 A 法设计一个规避方案——这样是头痛医头、脚痛医脚。要知道,中美的科技对阵会是动态变化的,而法案作为对阵的武器,也将是动态变化的。(注:2025年底,Meta 收购 Manus ,但据最新消息,Meta 对 Manus 的这笔收购也正在接受中国有关部门的评估,暂未决定是否审查。

此时此刻,选择成为一家中国公司还是美国公司,成为一个敏感、重要但艰难的选择

据漫谈 Light the Star 了解,今年,具身智能领域里一名绝对权威的华人学者正是因此决定归国创业——知情人士告诉我们,「教授原本在美国创业,但美国要求它与中国彻底完成切割。教授本人30多岁才到美国,对美国的归属感没有那么强烈。挣扎之下,最终才决定回国创业。」

「上一代的全球化创业已经彻底画上终结。」上述人士表示。过去,华人创业者会充分利用成本洼地的优势,把工程师团队放在中国(中国工程师的薪资远低于美国),「现在没人敢这么做了。」

在充满张力的两地局势下,立场已经不再允许暧昧不清,「但凡本土美元要投,必须要接受,彻底地成为一家美国公司。」


「1 亿美金融资额以上,就面临着和中国切割的选择。」一位中国的双币机构掌门人补充道。

她指出,创业者去硅谷,本身就是资本驱动的——「国内的情况是:3亿美金前很热闹,3亿美金后融不到。」原因在于,市场化的钱里,只有 VC 和投机的资金,而 PE 的资金真空了。

当逼近 3 亿美金估值的天花板时,不少创始人(具身智能除外,原因见后文)就会意识到,去硅谷,成为继续融资的一个选项。

但硅谷的钱并没有想象中好拿。

语言是第一道关。

口音其实不重要——硅谷本就汇聚了全球人才,是各类族裔的大熔炉。Llama Ventures 合伙人周航指出,「你可以满口口音,但不能表达不好。」另一个现实是,在中国被视作佼佼者的人才,放在硅谷的人才堆里,可能并不如人们想象中的出色和扎眼。更重要的是,中美文化差异巨大,许多中国创始人虽然人已来到硅谷,思维却仍是中国式的。

在见了数不清的中国创业者后,周航感慨,「许多创始人来了就马不停蹄开工,与时间赛跑。但都是瞎忙。」他给华人创业者的建议是,来到硅谷,要有充分的耐心和心理准备,「至少要有两三年的时间,才有可能真正适应美国。」

本质上,身份问题不是无法解决——「如果真的有大美元机构愿意开 big check(大笔投资),一堆投资机构会帮你想办法。」

上述不愿具名的投资人举了 Hygen 的例子,可能是近年来华人 AI 创业「硅谷化」最成功的「范本」之一:

2020 年,在 Snapchat 工作六年的徐卓(Joshua Xu)在疫情期间回国,在深圳创立「诗云科技(Hygen前身)」,旨在探索视频生成技术的商业化,起初接受了红杉、真格与百度的投资。三年后,Hygen 产品跑通,在海外画出一条恐怖的增长曲线,ARR 从百万美元一路飙升至逼近 1 亿美元门槛,成为准独角兽。

极强的现金流属性自然吸引来顶级的美元机构, Benchmark 合伙人 Victor Lazarte 亲自加入 Hygen 董事会,这在硅谷意味着某种「血统认证」——不过,在顶级美元入场之前,华人创业者也必须交出自己的「投名状」:从 2023 年底开始,Hygen 就开始游说早期股东接受回购,并取消个别董事的董事会席位,以实现彻底的资本隔离(确保在OIR界定的安全地带);另一方面,公司也将总部搬至洛杉矶,创始人常驻美国,以实现物理隔离。

就此,Hygen 跑通了一条「华人团队 + 中国技术红利 + 硅谷资本 + 全球市场」的极窄通道:在中美 AI 投资限制的冰点下,为众多华人创业者,真正提供了一场果决却有效的生存模板。

前述人士认为,对于 Hygen 来说,这并不是一个艰难的决定——第一步,你的用户和市场本就在海外,并找到了 PMF。第二步,吸引来本土美元愿意给你砸足够大的钱——一张两亿美金的 check;第三步,顺理成章成为一家美国公司。

但,绝大多数项目并不是 Hygen。在她看来,Hygen 享受了一段窗口期,即在大模型浪潮真正来临之前就已投入AIGC试水。显然,这个窗口期已然过去,今天的 AI 应用战场上,无疑是过分饱和的。

据漫谈light the star 了解,在硅谷,存在不少国内的 AI 创始人拿着旅签落地,意图在美国创业。这客观上违反了移民法。在合规的路上,也遍地是坑(中国创业者赴硅谷创业的法律问题,相关播客参见商漫第58期)——但相比全球化这条漫长的征程,身份问题显然只是第一个、甚至是最小的挑战。

另一名常驻硅谷的美元投资人说,「那些抱着硅谷「人傻钱多」的心态来这里找钱的,多半会铩羽而归。」

但周航也觉得,新一代年轻的华人创业者不同以往,「(大家看到)像米哈游创始人,国内那么大的成就不要了,跑到美国来重新开始。这些都是很好的榜样力量。」这是独属于这一代华人创业者的野心、见识和抱负。

「硅谷的 Bamboo Celing(竹子天花板,以「熊猫」暗喻华人,特指华裔因种族身份而在职业晋升中受阻)本来就在消弭,」前述人士认为,「当 Deepseek、Qwen、Manus 和 K2 这些中国大模型项目出现,Bamboo Celing 似乎彻底消失了。」


国内一级市场这边,也迎来了 AI 早期项目的短暂春天。

一级市场的本质是,有情绪才会有 fomo。

国内不少投资人也都能感知到,2025 年初,「市场的情绪和氛围到了。」

这种氛围是多种因素的混合作用:

  • 美股 AI 龙头的溢出效应:美国的 AI 资产估值飙升,给中国这些 AI 项目很好的对标作用

  • 港股和科创板 IPO 恢复,且在 2025 的表现都很不错,投资机构们在退出通道层面看到了曙光,于是,二级带动一级,上半年,美元基金们「手很松」。

  • 具身领域,宇树在春晚的爆火有着很长的长尾效应,机构们热情更高,催生更多创业项目诞生。

  • 消费硬件层面, 影石 · Insta 360 上市(《漫谈》的第40期播客,曾经记录了影石上市的10年历程),华米、安克在资本市场都有着不错的表现——冲到了较高的 PE 倍数。这使得出海消费硬件领域,投资人们更 fomo 了。


从年头到年尾,钱的流向主要汇集在四个方向:具身智能、AI 应用与 Agent、多模态、AI 硬件。CVC 在 2025 「疯狂扫货」:原因在于,面对日新月异的AI浪潮,手握充裕现金的巨头倾向以财务投资交朋友、补认知。

(1) 具身智能

2025 的春节,宇树机器人在春晚一舞的后效应,带动了整个具身智能领域的火热——使具身智能成为 2025 中国资本市场上无可争议的关键词。

「你能喊得上的每一家具身智能创业公司,账上都趴着不少于 10 亿元的现金流。」多名具身投资人、从业者验证了这一信息。如前文所述,具身智能不会面临「3 亿美金估值以上融不到」的问题——在中国,具身的头部企业虹吸着大量国资的人民币基金。这与国资的特性有关:

人民币基金偏好长周期的底层与硬件(芯片、具身智能)——周期长,免责,不出错;对应用层(Agent、软件)则非常谨慎——周期短、易被证伪、失败率高

另一层面的原因是,国家期待具身智能等硬件领域能够带动实体经济,并牵引中国从劳动力红利,转向具身智能红利。

但也有从业者指出,「机器人大脑」与 Agent 的本质相近,「抓手虚且烧钱重」,尽管国家队很积极,但认知仍在磨合。

(2)AI 应用与 Agent

而美元一直偏爱的应用叙事,在 2025 迅速升温。

一方面因为,基模的故事已经基本收敛,国内比较共识的答案是:千问、Deepseek、豆包、Kimi ,仍在牌桌(Minimax 技术实力很强,但面临着和大厂的竞争,因此看法不一)。年初,模型的底层能力(推理、coding)跃迁以及开源的燎原,一举将大模型推入应用时代,再加上模型价格战的普惠,AI 应用的时机成熟了。

上半年,头部美元基金明显活跃起来。「红杉、高瓴非常积极,上半年一个月可能投资 20 个项目,每个项目投资金额在一两百万美金左右。」

另一方面,对中国 AI 应用和 Agent 感兴趣的钱在变多。

「中东的钱也很乐意投资在中国的 AI 应用资产上。」一名接近中东主权基金的人士告诉我们。2024 年,由于美国方面的施压,限制中东主权基金直接投资中国 AI ,因此,彼时基模的投资的确会受限。「但是到了 AI 应用和 agent 这一波,就没关系。」

AI 早期浪潮中,好的应用产品常常带来指数级的增长(如前文提到的Hygen、Manus 等),而事实一再证明,好的数据能够带来超高的融资额——一个最新的贴切案例是,由字节 90 后产品经理陈冕所创立的 liblib 日收入达到 15 万美金且仍在增长,知情人士透露,liblib 的下一轮融资额将达到惊人的 8 亿美金。「尽管他们亏损也很厉害,但 liblib的社区粘性很高,这份高潜力还是让投资人愿意买单。」

一个小八卦是,在 liblib 估值 5 亿美金时,阿里曾经 drop 掉这个项目,而当项目涨到了 8 亿美金时,阿里一个回马枪又重新入场。

(3)多模态

到了下半年,Google 有了自己的 Nano banana,那么中国也得有。

中国市场急需一个能够代表中国视觉 AI 最高水平、且具备独立自主能力的底座模型——二级市场上,快手因为做出了可灵而迎来一轮市值的重估。中国已有的多模态模型创业项目里,生数科技和爱诗科技是其中的佼佼者——前者更侧重研究,后者已经完成不错的商业化。

但新的潜力选手还在被重注。从商汤秒画离职的刘宇创立的 Vivix.AI,迅速成为 2025 最受关注的 AI 项目之一。

刘宇毕业于香港中文大学多媒体实验室(MMLab),该实验室被誉为「计算机视觉界的黄埔军校」,由汤晓鸥教授创办。而刘宇本人,在商汤时曾主导过大规模视觉基座模型的训练,曾是几千张算力卡的「总指挥」——这种对底层算力调度和大规模参数模型的实操经验,是目前 AI 创业者中的稀缺能力。也因此,短短一年时间,Vivix.AI 的估值从 1 年前的 1-2 亿美金,飙升至最新一轮的 13.4 亿美金。而这个项目甚至还从未公开亮过相。

不过,据漫谈Light the Star了解,Vivix.AI 也将主攻海外市场开始起步。

(4)AI 硬件

这一年 ,也是 AI 硬件投资爆发的元年。

如果说,从 2023-2024,一级市场是在买「大脑」(模型),那么2025 年则是在买「身体(硬件载体)」

2025,是由技术、政策、和中国供应链红利,三者共同掀起的一场围绕硬件的投资热潮。

技术层面,推理、coding、Agent 的成熟,共同带来了 AI 硬件成熟的核心支点——当大模型「大脑」足够成熟,并有条件接入硬件后,智能硬件便开始具备「主动」服务的能力——这使得谈论多年的「人工智能助手」,开始成为现实。

以全球增速最快的 AI 硬件 Plaud 为例,表面看,这是最快将大模型接入录音传感器的团队,并因此获得了现象级的成功——成为全球增速最快的AI硬件;实质上,Plaud 产品背后,蕴含了团队对基座模型的精细化工程、下一代智能设备的深度理解,甚至包括对下一代智能基础设施的理解。(有关Plaud 的更多故事,可前往漫谈的第51期播客《Plaud许高首次深度讲述:全球增速最快AI硬件,与一种创业美学》)

Plaud 的故事背后,市场因此见识到一款高完成度的 AI 原生硬件作为消费品的爆发潜力,更重要的是,巨头们也纷纷意识到,一款贴身的消费硬件,作为收集线下用户数据和下一代交互的入口,在大模型的智能之争中,将起到极为关键的战略作用。

越来越多的玩家意识到,硬件爆发的背后,会是一场大模型的入口之战,也将是一次划时代的机遇。

而在这场战争中,可穿戴设备将成为最核心的战场——试想一下,当一款穿戴式设备能够实现 24 小时 always on,这将是大模型能够「宿主」的最佳载体。

其中,以 AI 眼镜赛道,成为 2025 的最大黑马

这一年的春天,Rokid 创始人祝铭明(Misa)为国家领导人试戴了自家产品 Rokid Glasses,照片很快登上了权威媒体——2025,智能眼镜在中国极速升温:阿里、字节、百度、小米等巨头纷纷入局开打。根据 IDC 预测,2025 年中国智能眼镜同比增长121%。(有关 AI 眼镜,可关注《漫谈》1.29 发布的对Rokid 的视频专访)

除了商业层面的时机成熟,政策的推动也是宏观上不可忽视的风向。

2025,作为「十四五」收官与「十五五」的衔接之年,AI 硬件作为「新质生产力」的核心载体,获得了大量政府引导基金和专项补贴的倾斜。据漫谈Light the Star 了解,一家头部智能眼镜公司最新一轮融资达到惊人的 20 亿人民币。而在国家出台的「人工智能+行动」里,也明确提到,2027 年,新一代智能终端普及率要超过 70%。

「今年硬件投资 fomo 情绪极强,项目被疯抢。」上述人士告诉我们,在多重因素的影响下,资本流向发生了结构性偏移——仅在 2025 年 5 月,流向 AI 硬件的资金就占到了 AI 领域总投融资额的 50% 以上。而截至 2025 年8月,中国在具身智能(机器人)与 AI 硬件领域的投融资总额已突破 386 亿元。

多名投融资从业者都认为,市场上许多项目的估值「疯狂到不可思议」——一种通俗做法是:适当地利用一级市场的 fomo 情绪,营造一种饥饿效应:先以额度紧俏与滚动估值制造项目的势能,后由 CVC 在 1-2 亿美元阶段承接。

「适当的泡沫是行业繁荣的标志,这是自然现象,只是其中一定存在押错注的个案。」上述人士说。

也正因为技术、政策和资本的三重汇合,硬件的创业潮在 2025 大爆发——「VC 们就差把工位搬到大疆门口了。」

说服大疆、拓竹、安克、影石、小米这些大厂中的技术和产品精英出来创业,是许多机构都在努力尝试的事。这种「孵化」做法,通常由投资机构提供明确的创业方向,给予候选人 2-3 个月的时间验证其执行力,如果项目推进顺利,则决定投资,反之则放弃。

「高瓴的口袋深,(像这种打法)一投可以投三五十家。」一名美元投资人说。

而对于更多的美元 VC 机构来说,投资上述这些大厂中的年轻人,成为一种不错的选择。

比起大厂高P,年轻人们在这些大厂中难以获得可观的股权分红,创业动力更强;这些非顶级高管的「草根」实干型人才,也具有更高的潜力和估值性价比。

以云启为例,2025 年,云启发起了一项专投 “98后” 创业者的投资计划。发起之时,“98后”的年龄上限恰好是27岁——「27岁是个神奇的数字,」云启资本管理合伙人陈昱说,纵观美国的商业史,无论是 Google、Facebook,还有当年 Microsoft 的 Bill Gates——他们当年创业的时候都没有超过 27 岁。

越来越多人正在相信,年轻人将带给这个世界无穷的可能性。


AI 时代,形成共识的窗口期极速缩短,投中顶尖项目越来越难。

这个时代的创业不再像上一个时代那样如此倚赖融资。创业的底层逻辑开始改变。

一位硅谷的投资人形容当下顶尖华人 AI 创业的三类画像,某种程度上就像美国的留学生:

  1. 刷盘子模式:指创业公司自有与主营业务不相关的现金流,如爆火之前的 Deepseek 主要靠量化交易获得收入,米哈游创始人蔡浩宇再创业等。

  2. 奖学金模式:因项目或技术团队的卓越表现,而获得全球顶级机构的融资,如 Manus,是所有基金都希望投中的目标。

  3. 集资模式:项目有「国家队」或是人民币基金的支持,通常与国家战略绑定,路径有所不同。

但客观来说,以上三者都不缺资金,资本呈现集中化。事实上,市场上绝大部分的钱,也都被少数项目拿走了。

优质标的稀少,出手也相对更难。市场上也因此延伸出两种投资风格:

一种是在热门赛道中「矮子里面拔将军」——重在参与。

另一种,则是坚持寻找真正有颠覆性、能够定义未来的项目,即使这意味着很长一段时间内不出手——上述投资人这样评价市场上的绝大多数项目,「只是把上一个时代的传统应用,用新 AI 技术再做一遍,就像在 ipad 上看报纸——可实际上,今日头条还没出现呢。」

而在这一轮应用投资热潮中,年轻一代格外积极。上一轮基模主要是基金管理人们的游戏,新一代投资人们在 AI 浪潮中也跃跃欲试,渴望投出代表作。「年轻一代的投资人们在机构里并非管理层,相比项目后续的发展和投资回报,他们更在意投出去了多少。」一位 FA 从业者说,「任何一个项目跑出来,能写在日后的履历里,就很值了。」

陈昱形容,当下的大模型时代就像是 10 年前的自动驾驶,「融资窗口往往就在那几个月内」——事后回看,最终留在牌桌上的数家企业,早在几个月内都集中亮相了。


简短回顾一下,2025 的基础大模型之争,像是一场季度排位赛。

年初(Q1)被行业高度讨论的是 Deepseek,年中是 Anthropic,到了下半年,则变成 Gemini ——「变得太快,」一位二级市场分析师坦言,硅谷巨头大厂之间激烈的竞争与博弈,牵动着美股市场的变化,局面发展变幻莫测,「看不清(走势),二级市场都不知道怎么做明年的定价。」

年初,Deepseek 和 Qwen 的开源开启了大模型普惠时代,直接带动英伟达股价暴跌。5月,Claude 发布 Sonet 3.7 ,催生了大批 coding 项目以及 Agent 项目爆发,在很多人看来,这也是一次标志性的分化——一种具代表性的声音认为,「基模最终仍会是巨头大厂之间的 PK,创业公司要尽早聚焦,发展自己的差异化优势。」Claude 选择放弃 toC 和多模态,而选择聚焦 coding 与 Agentic ,是基于竞争局面的一种选择。

该如何看待硅谷几家头部巨厂之间的模型之争呢?

(1)王者对决:OpenAI 与 谷歌

坐上王座的巅峰对决,目前仍然只属于 OpenAI 和 Google 之间

作为先发者,OpenAI 始终保有先发优势,这家公司一边训练模型冲击 SOTA,一边全力加速产品化——一份二级市场流传的 OpenAI 算力消耗财务表上显示,这家公司仍然将更大比例的算力消耗在训练模型,而非推理,「这意味着,OpenAI 还在拼命训模型。」

但随着 GPT-5 发布(2025.8.8),现有 Transformer 架构下的 Scaling Law 的天花板初现:不止一位业内人士指出,GPT-4 开始有些「挤牙膏」的现象,「模型能力的提升幅度没有想象中大。」(漫谈在第48期《对话OpenAI前科学家》的访谈中,嘉宾 Ken 和 Joel 曾经预言过这一点)


而作为本年度大放异彩的谷歌,则实实在在地打出一场翻身仗:Gemini 2.5 Pro 横扫各大榜单,其 Elo 评分一度超越了包括 GPT-4o 和 Claude 3 Opus 在内的所有对手,是史上首次有模型同时制霸文本、视觉和 Web 开发三大榜单;8月底,Nano Banana 爆火出圈,而到了 Gemini 3 pro,不少业内人士认为其回答效果已经超过了 GPT-5.1——「Gemini 的多模态效果远比 GPT 稳定,而 memory 的部分早在 2.5 时期就优于 GPT-4了」。

10 月在硅谷,我与谷歌 Deeepmind 的研究员有过一次交流,他告诉我,作为最早喊出 AI First 的公司,看着自己发明的 Transformer 被 OpenAI 应用到极致(并成为硅谷权力的中心),谷歌的过去两年一度是煎熬的——

「更早之前,谷歌的研究方向更发散和前沿。」这位研究员透露,自 2022 年底开始,谷歌开始了对 OpenAI 的全面追赶之路——代价是,暂缓其他前沿研究方向,举全公司上下之力高度聚焦于现有 LLM 方向。过程中,原 Google Brain 团队与 DeepMind 团队在合并(2023.4)后,也经历过一段磨合和阵痛期。

现在看来,谷歌胜利了吗?

这位研究员却摇摇头,「当下的胜利只是阶段性的成果。如果拉长时间来看,无法确定此刻所选择的「聚焦」,究竟是彻底的胜利,还是牺牲了其他前沿方向的、更大的机会成本。」

但随着谷歌重回王座,带给 OpenAI 的压力陡增,现在,换 OpenAI 拉响红色警报了。

「谷歌今年这一通操作,会让 OpenAI 的压力非常大。」多位身居硅谷的 AI 从业者表示,谷歌凭借 TPU、云设施和AI 技术的深厚底蕴,其优势会更长尾。而表面看,当下,与谷歌对阵的是 OpenAI,其实,一名隐身的大玩家微软,一直坐在牌桌的暗处——通过投资 OpenAI ,微软成功转型为生态的「托举者」,一系列 AI 布局的投资让它始终占据 AI 时代的核心位置。

但有趣的是,OpenAI 与微软之间已生嫌隙:「因为不想和 Azure(微软的云平台) 绑定,Sam 找来了新的盟友黄仁勋——两者一起搞了「星际之门」,希望把 AI 的泡沫吹得更大」———在许多观察者看来,这标志着 OpenAI 的去微软化,「这是今年硅谷巨头的 AI 大战中,最可堪回味的一幕。

(2)英伟达的合作连横

另一位可被视作大 BOSS 的重要玩家英伟达,则延续一贯的合纵连横:左手与 OpenAI 达成深度战略合作,右手将马斯克的 AI 推理芯片团队 Groq 收入囊中。

2025 年 9 月 ,NVIDIA 给出向 OpenAI 分批投资高达1000 亿美元的承诺,前提是这些资金要用于部署 NVIDIA 的系统,而在这场深度同盟的战略中,还有一个重要的角色——「Oracle(甲骨文)作为小弟,成为了一个带资进组的超级基建承包商,为星际之门的三角关系完成了一个完美的闭环」。

根据这场三方的约定,这个闭环可以简单理解为:

  1. NVIDIA投钱给OpenAI

  2. OpenAI用这笔钱向Oracle购买云服务。

  3. Oracle转手就得把这些收入(甚至更多)交给NVIDIA,用来购买数以十万计的 GB200 等顶级芯片来搭建数据中心。

市场一度认为,只要成为 OpenAI 的基建商,Oracle 就会成为下一个英伟达——因为「星际之门」,甲骨文的股价一度在 9 月一飞冲天,单日股价涨幅接近40%,创始人 Larry Ellison 甚至短暂超越马斯克成为世界首富——但不到一个季度,市场便发现,「大哥(OpenAI 和 Nvidia)的小弟不好当。」

2025 年底的财报显示,Oracle 的自由现金流开始转负——这是「星际之门」的代价。进入第四季度,Oracle 的股价遭遇了剧烈的回调,距最高点又跌去了近40%。一个更重要的信号是:对这些云公司来说,目前,云服务的收入抵不上租卡的成本

而另一边,英伟达也正在花 200 亿收购 Groq 的 AI 芯片资产 LPU ——原因在于,市场需要一款基于大模型的原生芯片:Groq 的 LPU 宣称在运行大模型推理时,比 Nvidia 的 GPU 速度更快、成本更低,剑指千亿美元规模的 AI 推理市场。面对这样的威胁,英伟达选择直接以「钞能力」化解技术威胁,将对手转化为生态伙伴。

这也是2025,硅谷 AI 领域正在发生的故事:在 LLM 领域,市场叙事正在从单项的技术挑战,转向现有技术的生态团战

这个趋势背后的另一面是:即便在 SOTA 的模型之中,差异化也在变小,各家优势领先的窗口正在快速缩短——比如上半年,Anthropic 在 coding 能力上曾大幅领先,但到了下半年,其他头部模型厂商也将将追平了: Groq 4、Gemini 等模型在 Benchmark 上追赶迅速,国内智谱也宣称在 coding 能力上能与之齐平。

(3)马斯克与扎克伯格,仍在奋力争取上船

徘徊在王座周围的另两个玩家:马斯克和扎克伯格,正在全力争夺大模型决赛圈的门票。

X.AI 正通过情感陪伴平台、编程模型等打造产品矩阵,利用 Twitter 数据源和自身工程能力,积极进行着错位竞争。

Meta 呢。可能是当下最着急的大厂。

作为曾经的开源王者,自 LLAMA 3 之后,Meta 的风光不再——在 AI 基础模型的正面战场,Meta 目前几乎是全面溃败——多位在硅谷的观察者都表达了同一观点,目前的顶级模型圈中,Meta 已全面掉队

「(基础模型)Meta 已经落后了,(至少)未来半年也一定会是落后的。」上述从业者认为。

面对落后局面,Meta 不惜 10 倍重金挖人,掀起硅谷 AI 人才争夺战——被认为是扎克伯格为了追赶 SOTA 所下的一剂猛药。但许多人认为,「这极可能破坏了原本内部共事的文化。」

在 Meta 内部,组织的专注度被认为不足,且存在整合困难等问题——PPIO 创始人姚欣今年在硅谷了解到的信息是,在 Leceun 离开 Meta 之前(2025.11),Meta 内部围绕 AI 同时并行着四个团队:1. 原 LLAMA 团队继续保留 2.另成立一个约40-50人团队,将整个闭源模型的预训练重做一遍 3. Lecun 带领研究团队继续搞前沿研究 4.新建一个围绕 AI 做基础设施的团队。

在姚欣看来,当下所有大厂的问题并非创新,而在组织。某种程度上,Meta 正在经历 2023-2024 时期的谷歌——「Google brain 和 Google Deep mind 组织上合并后,并不意味着战略和执行力也都合一了。」面对当下的变局,Meta 的上层组织,需要一位既有技术威望(能统一不同技术路线且能服众)、又有足够手腕(能应对组织之变)的一号位领袖。而当下,扎克伯格所选择的 Alexander Wang(原 Scale.ai 创始人)能否担此重任,仍是一个未知数。

一个客观事实是,二级市场,又开始出现做空 Meta 的力量。

在以上的背景下,2025 的最后几天,Meta 再次投掷下一枚科技圈炸弹——豪掷数十亿美元收购 Manus 。

这又是一次用资本,兑换技术时间和市场势能的竞速赛,也可能是一种重要的暗示:在模型与智能体之间,Meta 可能正在腾挪重心,向后者靠拢——毕竟,在自己并未训练模型的情况下,Manus 仍然实现了 SOTA 级别的智能体性能。

这意味着,即便没有造出最强的模型,如果打造出最强的智能体执行层,也有机会写下另一种剧本——

在智能体这片全新的战场,Meta 已经挑中一片新的山头。


作为行业风向标式的年度报告,由知名 AI 投资人内森·贝纳克(Nathan Benaich)和伦敦的 AI 专项基金 Air Street Capital 联合发布的《State of AI Report 2025》中,首次将「中国AI体系」从「外围追赶者」提升为「平行竞争者」。报告写道,2025年,中国不再是追赶者——「它正在开源 AI 和商业化部署方面设定节奏」

客观上,中国的大模型能力仍然无法引领世界 SOTA 水平,这是基础设施决定的——「美国公司们都在用 blackwell 了,明年甚至会用上 Rubin ,中国创业公司还只能用水货。」

落后便会走向开源,但开源,正带来全新的叙事。

在开源领域,以 DeepSeek、Kimi、Qwen 为代表的中国模型,在多项关键性能指标上实现了对曾经的开源王者 Meta(Llama系列)的全面反超。开源看中国,正在成为全球的共识。

中国模型梯队,也在 2025 年,完成了一场商业意义上的「超车」——凭借更高的模型性价比,中国模型正在成为全球的选择。以智谱为例,其 coding 能力在全球排名靠前,但定价仅为 Anthropic的 1/7,凭借这样的价格优势,智谱拿下不少国家主权大模型的订单。据姚欣介绍,「下半年,硅谷的创业公司都开始切换 Qwen、Deepseek 和 K2。


当时间行进到 2026,大模型浪潮已经足足演进了三年有余。

从时间线来看,大模型的能力分别经历了:2022年底预训练(Pre-training)的爆发,以及 2024 年底强化学习的爆发。

据了解,2025 年,看到 Deepseek 等中国模型通过后训练大幅降低了成本,海外模型公司正在加强对后训练(post-training)的投入,而中国模型也开始补课,为了追赶底层的泛化能力,大多仍以预训练为主,其中,阿里和 Deepseek 正在大力投入 post-training。

(注:预训练聚焦习得知识与常识,学习语言的规律;后训练则聚焦指令追随、对话、推理以及对齐人类价值观。)

「目前还没有迹象能够证明后训练是未来,」一位从业者称,「大家都在探索下一个 Scaling law 在哪里。」

但 2025 年尾,围绕 Scaling Law 是否已经到达天花板的争论,硅谷产生了两种思潮。

LeCun (Meta) 和 Ilya 为代表的「撞墙派」认为,单纯堆算力和数据(Pre-training)的边际效应正在递减,必须转换新的范式

而以Hinton 和 Dario Amodei (Anthropic CEO)为代表的「Scaling Law 不死派」,则认为,Scaling Law 仍然有效,只是形式会变,且正在转向 Inference-time Scaling (推理侧扩展)。比如,Anthropic 的路线图显示,通过改进数据质量和训练方法,模型在未来几年内依然会以指数级速度变强。Claude 3.7 的发布(混合推理)正是这一理念的体现。

围绕这个问题(Scaling Law 是否已逼近了天花板),我访谈了诸多行业从业者,其中一种声音可能具有很大的价值,在此分享给大家:

Scaling Law 正经历从「模型尺寸大小」的 scaling(已经开始放缓),过渡到「模型思考深度」的 scaling(正在发生),未来还将产生 agent 智能体之间协作所诞生的网络效应的 scaling——这是非常值得期待的。

只靠堆砌预训练数据和参数量 (Pre-training Scaling)的时代已经接近尾声。这意味着,低垂的果实快被摘完了。

且在大家抢夺低垂果实(疯狂怼算力和数据)的过程中,训练成本过高,代价可能过大。


另一个趋势是,AI 正在从数字世界,迈向物理世界(更多内容可查看漫谈播客第41期《对话智源王仲远》)。更多的商业公司试图在现实世界与数字世界间架设起高速公路:

  • 一边,是在现实世界中添置更多传感器,以便从现实世界获取更多数据,也为现实世界搭建一个孪生的数字世界;便于更好地训练AI,让 AI 更懂用户,以便更具主动性。

  • 另一边,让 AI 理解物理世界的运作规律,也成为重要的前沿研究方向,其中,世界模型为一个代表,从语言模型的「Next-token prediction」,过渡到多模态和世界模型的「Next-state prediction」。


回顾大模型过去两年演进的进程,底层能力的跃迁虽然带来应用窗口,但行业仍处于萌芽而未爆发的早期。

大模型像巨兽一样吞噬着金钱和算力,但随着战线的拉长,所有的巨额投入都会蒙上更大的压力。

即便 OpenAI 被认为是全球最成功的 AI 公司之一,根据其 Q4 在一级市场流传的数据,OpenAI 2025 的年化收入达 200 亿美金——已属一骑绝尘,但今年仅算力租卡成本就高达 160 亿美金——这是令市场倒吸一口凉气的数字,其经营性利润亏损 119.2 亿美金。

这意味着,OpenAI 每赚到 1 美元,就净亏损 0.6 美元(比起 2024 年每赚 1 美元约亏损 1.35 美元,盈利情况有所好转)。相比之下,拥有算力和更成熟基建的谷歌和 Meta,利润则好看很多——这是一个对创业公司的警告。

乐观者认为,目前AI 技术成本虽高,但 TOKEN 性价比却在以十倍速提升,预计 2026,很多场景就能充分应用。

但除了模型训练成本外,推理成本也在暴涨(也就是前文所述的,推理侧扩展的 scaling)——这将是全行业的趋势,当模型进入推理时代,会消耗比「训练」更海量的算力——这意味着大模型技术的成本会更大,但,新时代 AI 的商业模式却仍在探索。

注:除了订阅制、广告等传统模式外,RaaS(Result as a Service,按结果计费)和按 token 计费,成为新的探索路径。

PPIO创始人姚欣指出,2025,模型能力的提升其实有限,但 agent 的基础设施正在丰富,未来,可能通过并行开启多个 agent 来解决问题(即前文所述 agent 网络效应的 scaling),突破智能天花板。不过,这种方式成本高昂,对底层硬件芯片也提出了挑战。

在大模型的竞争叙事中,底层算力和基建的自控权,仍然是决定性因素极强的一组牌

美国已经开始大规模用债券、私募债等形式来支持算力资产(数百亿美元级别),这些举动的共同目标,就是把算力资产化。

国内的算力供给,则面临另一种现实瓶颈:由于政策叠加,进口算力买不到,且不允许买。市场关注的重点从「谁的卡更多」,转向了「算力可得性」。自建算力开始成为一种趋势:越来越多大企业意识到,若芯片与底层不自控,模型训练与推理的优化空间则受限。据了解,蚂蚁和米哈游,都在自建算力。当然,有条件自建算力的企业,屈指可数。

这些趋势共同指向:从底层到架构,再到模型,仍然是属于巨头之间的游戏。也因此,中国的云+基模层面,目前看来只剩下两家选手的对决:阿里(Qwen)与字节(豆包),其中,阿里的超算集群仍具有稀缺性。

据业内人士交流,中国基模的创业公司们,普遍面临着研发算力成本重,与现金紧张的问题,原因在于,大模型的融资中,算力折现和 PR 口径放大是普遍存在的现象,创业公司的名义融资金额与实际到账的金额存在差距

对于这些创业公司而言,追求模应一体,走产品化的路,成为一种现实主义的选择。

「我们现在看的是 model orchestration(模型编排),」Minimax 天使投资人陈昱说,模型编排是指,协调多个模型工作,以完成复杂的任务或实现更高效经济的更优解。从这个层面出发,创业公司的优势就能显现。

而卷 benchmark 也不再有意义,「每一家都会宣称是最厉害的模型,但面对应用与 Agent ,用户会用脚投票。」增长与留存,仍然是检验大模型产品的金线。一种声音认为,AI 应用的发展将会经历模型主导、模型与应用分离,以及产业结合三个阶段。

以上,是漫谈 Light the Star 在 2025 所获得的行业观察与趋势判断。与大模型一样,无法保证绝对准确,但求创造碰撞与启发。

欢迎在评论区,分享你赞同或是不同的见解与观察。期待在 2026 与大家继续相遇~

一起描述、定义、推动一个更美好的世界 :)

—— End ——

同期播客已经上线,欢迎前往小宇宙等平台收听




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
66岁的黑木瞳保养太好了,看着还像2,30岁!

66岁的黑木瞳保养太好了,看着还像2,30岁!

日本物语
2026-01-27 20:53:05
白酒会被90后00后终结吗?这是我见过最简明易懂的答案!

白酒会被90后00后终结吗?这是我见过最简明易懂的答案!

夜深爱杂谈
2026-01-28 18:25:29
杨鸣下课,辽篮崩塌始于郭艾伦被赶走!现在终于知道谁才是队魂了

杨鸣下课,辽篮崩塌始于郭艾伦被赶走!现在终于知道谁才是队魂了

嘴炮体坛
2026-01-28 21:19:48
向太曝马伊琍已再婚:当年文章过不了心理那关

向太曝马伊琍已再婚:当年文章过不了心理那关

娱乐看阿敞
2025-12-12 15:50:00
特尔施特根首秀救主,读秒神扑太关键

特尔施特根首秀救主,读秒神扑太关键

篮球看比赛
2026-01-28 10:20:25
3选1定终身!全红婵无缘退役安置,效仿张家齐带货能稳赚?

3选1定终身!全红婵无缘退役安置,效仿张家齐带货能稳赚?

卿子书
2026-01-18 09:27:36
1月28日,闫学晶儿子离婚?儿媳妇转移资产?真相来了

1月28日,闫学晶儿子离婚?儿媳妇转移资产?真相来了

深析古今
2026-01-28 13:57:46
1950 年,毛主席毫无预兆地怒而下令,周总理与聂荣臻急忙起身应对,众人纷纷揣测:他为何突然发火?

1950 年,毛主席毫无预兆地怒而下令,周总理与聂荣臻急忙起身应对,众人纷纷揣测:他为何突然发火?

源溯历史
2026-01-03 14:55:11
尼帕病毒或引发全球大流行?东莞疾控:人群普遍易感,避免前往这些地方

尼帕病毒或引发全球大流行?东莞疾控:人群普遍易感,避免前往这些地方

东莞好生活
2026-01-28 09:25:53
伊能静发文谈六十岁:剪了十年没剪的斜刘海,瘦了十斤

伊能静发文谈六十岁:剪了十年没剪的斜刘海,瘦了十斤

韩小娱
2026-01-27 16:58:56
上海炒股冠军肺腑之言:如果接下来迎来牛市,不妨死磕涨停回马枪

上海炒股冠军肺腑之言:如果接下来迎来牛市,不妨死磕涨停回马枪

股经纵横谈
2026-01-28 21:15:40
20岁浙江独生女泰国留学25天遭撕票!凶手是3名同胞,男友是主谋

20岁浙江独生女泰国留学25天遭撕票!凶手是3名同胞,男友是主谋

一盅情怀
2026-01-24 17:01:22
18岁儿子说晚上想和我一起睡,凌晨1点我感觉不对劲儿子说出真相

18岁儿子说晚上想和我一起睡,凌晨1点我感觉不对劲儿子说出真相

娱乐洞察点点
2026-01-28 16:07:45
窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

璀璨幻行者
2026-01-20 04:29:30
成都蓉城2026赛季主场球衣:灵感来源于成都市的夜色与光影

成都蓉城2026赛季主场球衣:灵感来源于成都市的夜色与光影

懂球帝
2026-01-28 10:13:22
为什么食品厂不怕员工偷吃?网友:之后20年没再吃这个东西!

为什么食品厂不怕员工偷吃?网友:之后20年没再吃这个东西!

夜深爱杂谈
2025-12-20 16:03:18
联合国掀桌!400岗迁出纽约,硬刚美国霸权

联合国掀桌!400岗迁出纽约,硬刚美国霸权

小噎论事
2026-01-27 19:01:46
三星堆竟不属于任何朝代?考古学家颤抖:中华文明源头要改写!

三星堆竟不属于任何朝代?考古学家颤抖:中华文明源头要改写!

芊芊子吟
2026-01-09 11:30:08
警惕!当白银、铜都和黄金一起讲故事,你的财富可能正被悄悄转移

警惕!当白银、铜都和黄金一起讲故事,你的财富可能正被悄悄转移

蓝色海边
2026-01-28 03:42:22
确认了:9级!浙江有雨夹雪、雪!这波太猛,明天提前准备

确认了:9级!浙江有雨夹雪、雪!这波太猛,明天提前准备

环球网资讯
2026-01-28 15:00:57
2026-01-29 00:24:49
卫诗婕商业漫谈 incentive-icons
卫诗婕商业漫谈
记录商业史和我们的时代。
21文章数 14关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

"盒马错发水仙"当事人索赔从375万降至48万:准备起诉

头条要闻

"盒马错发水仙"当事人索赔从375万降至48万:准备起诉

体育要闻

没天赋的CBA第一小前锋,秘诀只有一个字

娱乐要闻

金子涵拉黑蔡徐坤,蔡徐坤工作室回应

财经要闻

从万科退休20天后,郁亮疑似失联

汽车要闻

新手必看!冰雪路面不敢开?记住这4点 关键时刻真能保命

态度原创

家居
教育
手机
时尚
本地

家居要闻

跃式别墅 包络石木为生

教育要闻

回龙观第二小学小学教师专业发展项目启动会圆满举行

手机要闻

今年iPhone 18 Pro会涨价吗?分析师认为苹果将保持起售价稳定

想年前用3周“刷新”好状态?做第一点就够

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

无障碍浏览 进入关怀版