中国大模型加速追赶硅谷：月之暗面再获数亿美元融资，通义千问关键评测夺冠|推理

中国大模型加速追赶硅谷：月之暗面再获数亿美元融资，通义千问关键评测夺冠

2025-10-24 15:25:32　来源: 福布斯

上海举报

分享至

10 月 24 日，据财联社等媒体报道，国内 AI 大模型独角兽月之暗面即将完成新一轮数亿美元融资（目前处于交割进程中），这距离其上轮融资仅过去两个多月，显示出资本对中国 AI 大模型赛道持续看好。其开源模型 Kimi K2 在 2025 年 7 月国际权威大模型排行榜 LMArena 中位列开源模型第一，多轮对话能力全球领先，采用万亿参数架构但激活参数仅 32B，显著降低推理成本。

与此同时，阿里通义千问持续保持技术领先。其 2024 年推出的 Qwen2.5-72B 在 HumanEval、MBPP 等复杂推理与代码生成评测中进入全球前列，而 2025 年 9 月最新迭代的 Qwen3 系列进一步实现突破，其中 Qwen3-Max 在编程能力、智能体交互等维度显著提升，Qwen3-VL-Plus 则在视觉 coding 与超长视频理解领域达到国际前沿水平。

DeepSeek 近期动作频频，10 月 21 日发布创新性 DeepSeek-OCR 模型，采用上下文光学压缩技术，在 10 倍压缩比下精度达 97%；其 v3.2 685B MoE 模型引入稀疏注意力机制，长上下文推理速度提升的同时成本显著降低，该模型已通过微软、亚马逊云平台向全球提供服务。

除了这三家领军企业，中国大模型生态呈现百花齐放态势。字节跳动 Seed 团队 10 月 23 日开源的 Seed 3D1.0，采用 Diffusion Transformer 架构实现从单张图像生成高质量 3D 模型；腾讯混元图像 3.0 在 10 月 5 日 LMArena 文生图榜单中位列全球第一，超越谷歌、OpenAI 等企业的主流模型；快手可灵 AI 全球用户突破 2200 万，占据同类工具约 30% 市场份额，数据来自 2025 年 10 月行业最新统计。

应用落地层面，创新步伐同样迅速。10 月 23 日，夸克 APP 上线对话式 AI 助手，实现搜索与对话能力的无缝融合；10 月 24 日，中科曙光发布国内首个科学大模型开发平台 OneScience 并开放公测，该平台依托国产算力支持多学科科研场景，可将模型研发效率提升百倍，用户可通过超算互联网零成本体验。

支撑这些技术突破的是爆发式增长的市场需求。据国家数据局数据显示，中国日均 Token 消耗量从 2024 年初的 1000 亿增至 2025 年 6 月的 30 万亿，增幅约 300 倍。同时，国产大模型训练语料中的中文占比普遍超过 60%，部分达到 80%，显示出中文信息在全球 AI 格局中的重要性快速提升。

硅谷知名投资人马克・安德里森 (Marc Andreessen) 在谈及 DeepSeek-R1 模型时评价：“中国团队在模型架构与工程优化上的速度令人震惊，其开源举措堪称 AI 领域的‘斯普特尼克时刻’”。

业内人士分析认为，随着 AI 竞争从模型层延伸至应用层，中国正在形成 “技术突破与场景落地” 双轮驱动的发展路径，月之暗面、DeepSeek 等创业公司聚焦核心技术突破，而阿里巴巴、腾讯、字节跳动等巨头则凭借其生态优势加速技术商业化。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.