网易首页 > 网易号 > 正文 申请入驻

“重磅炸弹”,来了

0
分享至

来源:市场资讯

(来源:中国新闻周刊)

2025年,越来越多的人习惯让AI干活了。

刘茹是一名大学教师,今年,她每天都会找豆包App解答问题,尤其喜欢在国外逛博物馆时给豆包视频通话,让它实时讲解。工作上,她还用智能体开发平台扣子(Coze)搭建了一个科研助手智能体,让它参与生成研究方案等。

最近,刘茹的工具库又密集上新。11月中旬,谷歌(Google)发布Nano Banana Pro,能生成效果顶尖的视觉化信息图;阿里巴巴推出千问App,她认为很适合写办公材料;蚂蚁集团推出灵光App,她用文字描述出脑中灵感,就能迅速“手搓”出一个小应用或小游戏。

AI的干活能力日益精进的背后,是一个竞争激烈的全球大模型战场。北京时间11月18日上午,埃隆·马斯克(Elon Musk)旗下xAI发布Grok 4.1,紧接着,19日凌晨,谷歌新推出的Gemini 3 Pro。12月1日,DeepSeek发布DeepSeek-V3.2,在公开的推理类基准测试中达到GPT-5水平,略低于Gemini 3 Pro。

从普通人的工具包到科技巨头的竞技场,城头何以频换大王旗?


越来越多的人运用AI完成一些工作。图/视觉中国

“觉醒”的大厂

11月中下旬,AI战场的平静骤然打破:谷歌与阿里几乎同时向市场投下“重磅炸弹”。

北京时间11月19日,谷歌接连发布Gemini 3系列模型,同步上线Gemini 3 Pro预览版。据谷歌技术报告,在一系列广泛认可的核心基准测试中,Gemini 3 Pro的表现都优于GPT-5.1和Claude Sonnet 4.5,包括推理、多模态、代理工具使用、多语言性能和长上下文等。2天后,谷歌又推出基于Gemini 3 Pro打造的图像生成模型Nano Banana Pro。

这让谷歌完成了一次全方位“屠榜”。AI模型评测平台LM Arena因其盲测机制和Elon评分系统受到业内认可,其评测分数显示,截至目前,Gemini 3 Pro位列文本、视觉、搜索能力榜单首位;Nano Banana Pro和谷歌今年10月推出的Veo 3.1又分别占据了图像生成类、视频生成类榜单的首位。

此前很长一段时间里,谷歌陷在行业由OpenAI领跑的被动局面里,被业界评价为“沉睡的巨头”,如今后发制人,攻防形势逆转。除技术领先,Gemini 3 Pro还被集成进谷歌搜索的AI 概览功能和企业平台Vertex AI,能迅速向全球数十亿用户普及。

地球的另一端,阿里也在“觉醒”。11月17日,阿里宣布千问App正式公测上线,对所有用户免费开放,这标志着阿里确立了AI超级入口,全面进军C端(消费级)市场。上线一周后,千问下载量突破1000万。达成这一目标,DeepSeek在今年初用了约20天。

千问在发布后密集更新。12月3日,千问接入学习大模型Qwen3-Learning,新增拍照答疑、作业批改两大功能。办公功能也进一步细化,以AI写作为例,用户可以选择论文、诗句、高情商回复等30余种场景,指定仿写、润色、扩写等6种目标。

11月18日,蚂蚁集团推出灵光App。灵光特别强调了创意生产的低门槛,用户输入一句话,“闪应用”功能最快能用30秒生成一个小应用或游戏。上线两周后,灵光累计生成了330万个“闪应用”。

阿里在C端的野心有些“姗姗来迟”。毕竟,早在今年2月“DeepSeek风暴”席卷后,字节跳动的豆包、腾讯的元宝就开启了市场争夺战。据Quest Mobile数据,今年9月,豆包和元宝已分别达成1.72亿、3286万的月活跃用户规模。

过去,阿里主要凭借通义千问(Qwen)模型家族在B端(企业级)市场建立优势,模型和产品多以“通义”为名。此次明确将原生App更名“千问”,标志着阿里的技术优势与品牌战略完成关键整合。

谈及千问的“技术底气”,阿里千问相关负责人表示,今年9月,阿里云发布Qwen3-Max模型,基于通义大模型,该模型是最新的参数规模超万亿的旗舰模型,多模态能力和推理能力较此前有了很大提升。“阿里的大模型经过了3年的发展,才使得打造一款真正好用的AI助手成为可能。”

“过去半年,国内C端大模型的竞争异常激烈。这带来了压力,也为我们提供了很多提升产品和体验的外部视角。”他对《中国新闻周刊》表示,市场从“技术演示期”快速进入了“体验竞争期”,用户对AI助手的期待值被迅速拉高。

“用户希望AI能真正成为提升效率、解决问题的实用工具。”上述负责人表示,C端产品竞争最终比拼的是能力和体验,一个合格的AI助手需要具备解决用户真实需求的办事能力,背后有真实的生态服务支撑,并做到体验顺畅、操作简洁。

大厂争夺AI超级入口的本质是生态之争。千问正计划接入地图、外卖、订票、办公、学习、购物、健康等生活场景,并将在未来实现跨业务的任务执行与信息查询,这依赖于阿里在电商、支付、生活服务、云计算等领域积累的生态资产。

近日,战火再度升级。12月1日,字节联合中兴通讯推出一款搭载豆包手机助手的AI手机,拟实现跨应用自动操作能力。由于“触发了常规安全机制”,微信将使用豆包操作的账号判定为环境异常,限制其访问。阿里系应用通过频繁弹出人机验证、触发闪退和登录拦截等应对这一自动化操作。

谷歌和阿里的“觉醒”只是序幕。技术、产品与商业的三重考验横亘于新的大模型战场上,任何一处赛点都可能是反超或逆转的关键。





图/视觉中国

中国模型“上桌”

据悉,千问海外版也即将上线,以ChatGPT为全面竞争对手。2025年,中国大模型在技术性能方面实现了关键跃升,为出海提供了底气。

据AI评测机构Artificial Analysis数据,今年1月,仅有1个中国模型进入其评定的全球模型综合排名15强榜单,其余均为美国模型;到11月,中国模型则共占据5席。

在全球开源生态中,中国大模型地位的攀升更为突出。12月初,大模型API聚合平台OpenRouter和风投机构a16z联合发布《基于OpenRouter的100万亿词元(Token)实证研究》,其中指出,自2025年年中开始,全球的开源生态结束了由DeepSeek一家垄断的局面,竞争态势多元化,词元使用(Token Volume)均匀地分布在5—7个模型之间。

去年11月至今年11月,在开源模型中,DeepSeek系列模型使用了最多的词元,达14.37万亿;其次是阿里的Qwen系列,达5.59万亿。再加上MiniMax(稀宇科技)、Z.ai(智谱)、Moonshot AI(月之暗面)的数据,中国开源模型的总使用量达23.32万亿,占前10名总使用量的71.1%。

报告还指出,今年,开源模型已成为创意角色扮演、编程辅助等特定场景的首选。在部分周内,中国开源模型的使用量一度达到全球总使用量的近三成。简体中文成为全球第二大交互语言,占总使用量的近5%。

中国开源模型吸引了越来越多的全球工作者,尤其是在硅谷。例如,今年6月,亚马逊新组建具身智能部门,其开发团队宣布以Qwen3.0为基础模型,结合DeepSeek蒸馏技术打造具身智能底座模型。

10月,美国公司爱彼迎(Airbnb)CEO布莱恩·切斯基(Brian Chesky)公开谈论了技术团队的选择。据彭博社报道,爱彼迎于5月向美国用户推出AI客服智能体,由13种AI模型构建,包括OpenAI、阿里、谷歌及其他开源模型。“我们在很大程度上依赖阿里的 Qwen模型,既出色又高效,成本还低。我们也使用 OpenAI 最新模型,但通常在生产中使用有限,因为还有更快、更便宜的模型。”切斯基说。

NBC采访了超15位AI行业资深人士,他们表示,过去一年中,许多中国系统不仅接入成本更低、定制化程度更高,且性能已足以满足多种使用场景的需求。

“通常,我们先用闭源模型实现某个功能,然后发现它太贵或太慢,于是会问:有什么办法能让它更快、更便宜?这通常意味着用等效的开源模型替代闭源模型,然后在我们自己的基础设施上运行。”AI搜索初创公司Exa的机器学习负责人迈克尔·发恩(Michael Fine)说。

不过,美国顶尖模型仍然在性能上保持领先,且以闭源为主。金融机构高盛在11月28日发布的一则研报中指出,美国基础文本和多模态模型在每次更新中持续保持领先地位,通常情况下,中国模型会在接下来的3—6个月内缩小差距,进行另一次升级更新。

零一万物CEO、创新工场董事长李开复对《中国新闻周刊》说,如果坚持闭源,中国公司“很难打败美国”。两年前,顶尖闭源模型和开源模型之间的“技术时间差”很大,现在已缩小到半年左右。未来,开源模型、开源免费的应用,将大大帮助中国模型和软件打开全球市场。不过,他也表达了担忧。美国公司付费购买企业级产品的意愿更高,能够促进应用、模型公司之间的良性循环,中国公司尚未建立起这一循环,相对滞后。

IDC中国人工智能研究总监卢言霞也提醒道:“性价比仍然是中国大模型出海的核心优势。目前,全球头部用户具有付费能力,技术与竞争格局尚未完全成熟,靠低价取胜的策略能否长久取胜,仍是未知数。”

美国巨头的“烧钱”规模也更庞大。据高盛研报,2022—2024年,美国五大云服务商亚马逊、微软、谷歌、Meta和甲骨文的历史资本支出达1570亿—2560亿美元,2025—2027年的预测支出将增至4380亿—6850亿美元。在中国,阿里、字节、腾讯和百度在过去三年共支出80亿—360亿美元,后三年预计支出590亿—750亿美元。




上图:2025年11月6日,2025年世界互联网大会“领先科技奖”在浙江嘉兴乌镇揭晓,阿里通义千问大模型获奖。图/新华

中图:2024年12月18日,2024火山引擎冬季FORCE原动大会期间的豆包图生图模型、文生图模型展区。图/IC

下图:2025年7月29日,2025世界人工智能大会上的可灵AI文生图、文生视频展区。图/IC

更会“干活”的AI

全球大模型竞争持续提速的同时,底层技术的竞争焦点也发生转移。

“大语言模型的竞争已步入相对成熟和收敛的阶段,可以预见在数据使用方面会面临越来越多的约束,模型性能提升的速率也明显放缓。”北京智源人工智能研究院院长王仲远对《中国新闻周刊》分析,全世界仍有海量图像、音频、视频、3D及传感器数据等多模态数据尚未被有效地开发训练,多模态模型成为新的核心战场,即如何在一个模型内实现跨模态的理解与生成。

今年下半年,多模态领域竞争提速。在LM Arena平台的文生图、图片编辑榜中,谷歌Nano Banana Pro领跑,来自德国初创公司的flux模型以及腾讯、字节、阿里、OpenAI的最新模型居其后;在文生视频、图生视频榜中,谷歌Veo-3.1领跑,来自OpenAI、阿里、快手和字节的最新模型,还有中国创业公司MiniMax的海螺2.3、生数科技的Vidu Q2居其后。

以视频生成领域为例。“今年,视频生成模型在画面美学质量、镜头运动、理解复杂物理规律等方面都刷新了上限。”MiniMax副总裁时惜之告诉《中国新闻周刊》。她表示,AGI(通用人工智能)的交互应是多模态的,团队正计划尽快推出一个多模态融合的模型,对标OpenAI的Sora 2和谷歌的Veo 3。

行业的另一个竞争焦点在于智能体能力(Agentic AI),指的是模型主动规划、调用工具、执行多步任务,并在一定程度上自主决策、与环境互动的能力。“在这种范式下,AI的角色不再局限于问答助手,而是升级为‘你定目标,我来完成’的执行伙伴。”峰瑞资本投资合伙人陈石表示。

据IDC统计,2025年,在行业企业中,已有近两成客户开始采用智能体平台。其中,当下落地较多的应用场景有智能办公助手、智能客服、对话式AI、市场营销等。

以灵光App为例,记者向灵光提出了“帮我设计一个日常监督饮食摄入的应用”的指令。运行过程显示,灵光首先定义了“饮食监督”的价值,确定应用核心指标、数据采集路径和反馈机制,接着构建了应用的交互框架、结构框架,再注入交互与计算逻辑,验证了关键路径后,它完成应用部署并验证可用性。最终,记者能在应用中选择用餐类型和食物,实时记录食物的营养成分数据。

今年,学界和产业界还提出了一个新的智能范式——世界模型(World Model)。过去几年,随着具身智能、智能驾驶等技术快速演进,除了理解文本、生成内容,AI还需要具备对真实世界感知和推理的能力。

今年10月底,智源研究院发布开源多模态世界模型“悟界·Emu3.5”,提出了世界大模型的一种构建路径。Emu3.5展现的世界模型核心能力包括连贯地推演长时程的视觉叙事、在虚拟探索中保持时空一致性,甚至为开放世界中的具身智能体规划行动。

王仲远指出,世界模型的核心是完成下一状态的预测(Next-State Prediction),传统大语言模型停留于对下一词元的预测(Next- Token Prediction)。“目前,世界模型的定义和技术路线都没有形成共识,中国和美国的研究都处于极早期阶段。”他说。


在大模型竞技场,无论大厂还是创业公司,都很难有永恒的领先优势。图/视觉中国

行业洗牌持续

在大模型竞技场,玩家间的“攻防易形”是一种常态。无论大厂还是创业公司,都没有永恒的领先优势。

即便是OpenAI也难以高枕无忧。今年7—10月,谷歌的月活跃用户规模从4.5亿增至6.5亿。10月底,据Similar Web数据,Gemini在桌面和移动端的单次平均使用时长达7.2分钟,首次超越了ChatGPT的6分钟。

OpenAI内部已拉响警报。在10月的一份内部备忘录中,CEO山姆·奥特曼(Sam Altman)提示员工,谷歌近期的进展“可能会给公司带来一些暂时性的经济阻力”。Gemini 3 Pro发布后,12月伊始,奥特曼宣布公司进入最高紧急状态,要求员工暂停广告、AI代理等多项非核心项目,将所有人力、算力与预算资源重新聚焦于ChatGPT的升级。近日,有消息人士披露OpenAI计划在12月第二周提前发布GPT-5.2,以追平差距。

这一幕似曾相识。今年1月底,DeepSeek凭借性能、成本优势和开源策略引爆全球关注,并在春节后迅速推动AI技术在国内各产业界落地。早在去年1月,MiniMax就发布了国内首个MoE大模型abab6,与DeepSeek架构一致。但当DeepSeek-R1掀起新一轮推理模型浪潮,MiniMax掉队了。据MiniMax创始人兼CEO闫俊杰回忆,在老家过春节时,几乎所有人,包括他的姥姥都问他:“你知道DeepSeek吗?”

闫俊杰深受触动。“为什么我们本来应该做到最好、最擅长的东西,反而容易出很大的问题?是因为降低了要求,还是没有思考更深呢?或许我们在一些选择上不够坚定。”他说。

后来,MiniMax内部也纠正了一个误区:大家原本以为用户越多,模型能力提升越快,实际上,更好的模型才可以导向更好的应用。“我们更加坚定了技术驱动的决心,专注提升模型的全球竞争力,再通过产品设计将模型的智能传递给用户。”时惜之说。

今年,零一万物和百川智能相继宣布退出通用大模型竞争。前者全面转向为企业提供AI解决方案和“超级员工”Agent服务,后者选择聚焦于医疗垂类模型。“AI六小虎”仅剩4席,各家公司内部都有管理层离职。

另一方面,创业公司还需应对大厂的降维打击。11月5日,阿里巴巴董事会主席蔡崇信在香港大学接受访谈时表示,阿里“不从AI本身赚钱”,而是主要通过提供支撑AI运行的云基础设施实现盈利。据阿里最新发布的2025年第二季度财报,7—9月,阿里云智能集团本季度收入达398.2亿元,同比增长34%,创近三年增速新高。

创业公司的生存命题恰恰是如何“从AI本身赚钱”,面临多重压力。首当其冲的是资金环境收缩。据IT桔子信息,今年下半年,MiniMax和月之暗面分别完成一笔3亿与6亿美元的融资,估值均约40亿美元。融资规模较2024年收缩近半。

李开复也认为,创业公司每年都要承担比前一年多几倍的基础设施成本,才有可能做出更好的底层模型,加上持续开源,将面临非常严峻的商业化考问。

但小型创业公司要想在基础模型上取得突破性进展变得异常困难。与此同时,大量的创业公司集中在相似的应用领域,如智能客服、内容生成、图像处理等,提供的服务高度同质化,缺乏真正的技术壁垒。

巨大的投入并未带来普遍盈利,很多AIGC应用仍处于烧钱亏损状态。行业分析机构QuestMobile数据显示,曾以“黑马”姿态席卷全球的DeepSeek,其月均下载量从2025年第一季度的8111.3万骤降至第二季度的2258.9万,降幅达72.2%;国际半导体研究机构Semianalysis的监测则显示,其用户使用率从年初的7.5%滑落至年中的3%。从行业整体来看,根据CB Insights统计,当前全球有498只AI独角兽(即估值在10亿美元以上的未上市公司),但这些AI初创公司当中,大部分未实现正向现金流。

“假如豆包是一个创业公司的产品,它已经花上了一个天文数字去得到用户了。”李开复说,“相比之下,大厂仍然有实力投入基础模型的研发,并将投入成本分摊到数十亿用户的身上。”李开复甚至预测,中国基座大模型最终大概率会收敛至3家主要公司——DeepSeek、阿里巴巴和字节跳动。他的判断依据是“企业是否愿意且能够持久投入,并拥有足够的创新人才密度”。

(文中刘茹为化名)

记者:王诗涵(wangshihan@chinanews.com)

编辑:闵杰

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2月16日俄乌:乌克兰的反击

2月16日俄乌:乌克兰的反击

山河路口
2026-02-16 20:49:43
17枚奖牌、高居第3名,米兰冬奥最强亚洲队诞生!中国至今0枚金牌

17枚奖牌、高居第3名,米兰冬奥最强亚洲队诞生!中国至今0枚金牌

十点街球体育
2026-02-16 11:49:23
霸气,湖人队卢卡·东契奇回击火箭队杜兰特对全明星赛的批评

霸气,湖人队卢卡·东契奇回击火箭队杜兰特对全明星赛的批评

好火子
2026-02-17 00:08:14
达索系统股票暂停交易,最新下跌7.6%

达索系统股票暂停交易,最新下跌7.6%

每日经济新闻
2026-02-16 18:03:04
春晚第一波梗出现了,网友:笑疯了

春晚第一波梗出现了,网友:笑疯了

91.6陕西交通广播
2026-02-16 22:55:14
2月16日俄乌最新:惊人的转变

2月16日俄乌最新:惊人的转变

西楼饮月
2026-02-16 17:08:41
王菲六登春晚,献唱《你我经历的一刻》,水滴钻石耳环再次出圈

王菲六登春晚,献唱《你我经历的一刻》,水滴钻石耳环再次出圈

可乐谈情感
2026-02-16 22:32:46
中门对狙?中方刚给30天免签,英加却要对等不了了!

中门对狙?中方刚给30天免签,英加却要对等不了了!

达文西看世界
2026-02-16 12:58:03
中国决定对加拿大持普通护照人员实施免签政策,加外长回应

中国决定对加拿大持普通护照人员实施免签政策,加外长回应

环球网资讯
2026-02-16 12:03:18
小米集团跌幅扩大至3%

小米集团跌幅扩大至3%

每日经济新闻
2026-02-16 09:54:04
汪小菲晒年夜饭!丈母娘做了一大桌,给小玥儿和箖箖都做了爱吃的

汪小菲晒年夜饭!丈母娘做了一大桌,给小玥儿和箖箖都做了爱吃的

尺素a
2026-02-16 23:38:35
中建集团,全军覆没!

中建集团,全军覆没!

黯泉
2026-02-16 21:39:23
王菲水滴耳环再次出圈,网友立刻找到同款!窦靖童发文

王菲水滴耳环再次出圈,网友立刻找到同款!窦靖童发文

每日经济新闻
2026-02-17 00:23:36
美国兵推曝光:中国击沉4艘美航母后,美国或将对京沪进行核打击

美国兵推曝光:中国击沉4艘美航母后,美国或将对京沪进行核打击

纪中百大事
2026-02-14 16:40:09
春晚49个节目,仅3个小品无相声:为何我们最想看的,反而最少?

春晚49个节目,仅3个小品无相声:为何我们最想看的,反而最少?

补两刀
2026-02-16 19:12:21
机器人“霸屏”春晚上演IPO大赛,谁是资本盛宴背后的最大赢家?

机器人“霸屏”春晚上演IPO大赛,谁是资本盛宴背后的最大赢家?

野马财经
2026-02-16 12:02:12
春节到了!成都上演空城计,往日繁忙的路口竟然20辆汽车都没有…

春节到了!成都上演空城计,往日繁忙的路口竟然20辆汽车都没有…

火山詩话
2026-02-16 11:24:30
辛酸!57岁王菲六登春晚,唱功失准,只能靠眉毛和耳环上热搜

辛酸!57岁王菲六登春晚,唱功失准,只能靠眉毛和耳环上热搜

呀古铜
2026-02-17 01:08:08
中国为何迟迟不武统台湾?美国专家的一席话,令全场鸦雀无声

中国为何迟迟不武统台湾?美国专家的一席话,令全场鸦雀无声

古史青云啊
2026-01-16 14:25:32
迪丽热巴人鱼公主杀疯了!水下跳舞美到失语,这哪是春晚这是深海幻境

迪丽热巴人鱼公主杀疯了!水下跳舞美到失语,这哪是春晚这是深海幻境

动物奇奇怪怪
2026-02-16 22:53:28
2026-02-17 02:59:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2224096文章数 5488关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

全明星正赛美国星辰队夺冠 爱德华兹MVP

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

家居
房产
艺术
本地
公开课

家居要闻

中古雅韵 乐韵伴日常

房产要闻

三亚新机场,又传出新消息!

艺术要闻

名家笔下话过年,别有风味!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版