10 月 24 日,据财联社等媒体报道,国内 AI 大模型独角兽月之暗面即将完成新一轮数亿美元融资(目前处于交割进程中),这距离其上轮融资仅过去两个多月,显示出资本对中国 AI 大模型赛道持续看好。其开源模型 Kimi K2 在 2025 年 7 月国际权威大模型排行榜 LMArena 中位列开源模型第一,多轮对话能力全球领先,采用万亿参数架构但激活参数仅 32B,显著降低推理成本。
与此同时,阿里通义千问持续保持技术领先。其 2024 年推出的 Qwen2.5-72B 在 HumanEval、MBPP 等复杂推理与代码生成评测中进入全球前列,而 2025 年 9 月最新迭代的 Qwen3 系列进一步实现突破,其中 Qwen3-Max 在编程能力、智能体交互等维度显著提升,Qwen3-VL-Plus 则在视觉 coding 与超长视频理解领域达到国际前沿水平。
DeepSeek 近期动作频频,10 月 21 日发布创新性 DeepSeek-OCR 模型,采用上下文光学压缩技术,在 10 倍压缩比下精度达 97%;其 v3.2 685B MoE 模型引入稀疏注意力机制,长上下文推理速度提升的同时成本显著降低,该模型已通过微软、亚马逊云平台向全球提供服务。
除了这三家领军企业,中国大模型生态呈现百花齐放态势。字节跳动 Seed 团队 10 月 23 日开源的 Seed 3D1.0,采用 Diffusion Transformer 架构实现从单张图像生成高质量 3D 模型;腾讯混元图像 3.0 在 10 月 5 日 LMArena 文生图榜单中位列全球第一,超越谷歌、OpenAI 等企业的主流模型;快手可灵 AI 全球用户突破 2200 万,占据同类工具约 30% 市场份额,数据来自 2025 年 10 月行业最新统计。
应用落地层面,创新步伐同样迅速。10 月 23 日,夸克 APP 上线对话式 AI 助手,实现搜索与对话能力的无缝融合;10 月 24 日,中科曙光发布国内首个科学大模型开发平台 OneScience 并开放公测,该平台依托国产算力支持多学科科研场景,可将模型研发效率提升百倍,用户可通过超算互联网零成本体验。
支撑这些技术突破的是爆发式增长的市场需求。据国家数据局数据显示,中国日均 Token 消耗量从 2024 年初的 1000 亿增至 2025 年 6 月的 30 万亿,增幅约 300 倍。同时,国产大模型训练语料中的中文占比普遍超过 60%,部分达到 80%,显示出中文信息在全球 AI 格局中的重要性快速提升。
硅谷知名投资人马克・安德里森 (Marc Andreessen) 在谈及 DeepSeek-R1 模型时评价:“中国团队在模型架构与工程优化上的速度令人震惊,其开源举措堪称 AI 领域的‘斯普特尼克时刻’”。
业内人士分析认为,随着 AI 竞争从模型层延伸至应用层,中国正在形成 “技术突破与场景落地” 双轮驱动的发展路径,月之暗面、DeepSeek 等创业公司聚焦核心技术突破,而阿里巴巴、腾讯、字节跳动等巨头则凭借其生态优势加速技术商业化。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.