中信建投：全球大模型迭代看好国内AI加速赶超海外|模态|编程|kimi

中信建投：全球大模型迭代看好国内AI加速赶超海外

2025-11-17 07:58:07　来源: 智通财经

广东举报

分享至

智通财经APP获悉，中信建投证券发布研报称，海外GPT-5.1更新围绕效率和个性化升级，国内模型同样加速迭代。百度(09888)文心5.0多模态理解能力较为突出，有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首，前者专为 Agent 和代码而生，成本仅为Claude 3.5 Sonnet的8%；后者则将在token效率、情感表达等模型工程化方向不断迭代，优化模型表现。后续凭借国内工程化优势，以及庞大用户群体提供的使用反馈，国产模型及AI应用产品存在赶超海外的基础。

中信建投主要观点如下：

GPT-5.1更新，围绕效率和个性化升级。2025年11月13日，OpenAI发布GPT-5.1，包括GPT-5.1 Instant和GPT-5.1 Thinking两个版本。据OpenAI官方公告，Instant比其前代产品“更热情、更智能，也更善于遵循用户指令”，Thinking则“更容易理解，处理简单任务速度更快，处理复杂任务也更持久”。同时，OpenAI进一步升级GPT的路由能力，使其能根据问题复杂程度精准地调整思考时间。此外，OpenAI还进一步优化了GPT的风格特征设置，目前除默认设置外，还支持专业、友好、直言、古怪、高效、讽刺及书呆子等多种风格。

GPT-5.1相较于OpenAI之前的模型更新更注重用户偏好的提升（指令遵循、高效路由和风格预设），这意味着OpenAI也开始注重模型的工程化。当前全球头部模型能力基本满足大多通用场景需求，通过工程化提高效率和体验成为了各厂商亟待重视的方向。

国内模型加速突破，能力较国际前沿进一步看齐。近期国内模型加速迭代，开源模型榜首多次易主，进一步反映国内AI领域已逐步向海外前沿靠拢。后续凭借国内工程化优势，以及庞大用户群体提供的使用反馈，国产模型及AI应用产品存在赶超海外的基础。

百度：11月13日，文心5.0于2025百度世界大会发布，其采用原生全模态统一建模，支持文本、图像、音频、视频等多种信息的联合输入与输出，实现了原生的全模态统一理解与生成。在总参数规模上，文心 5.0 达到了系列最高的2.4万亿，并位列业界已公开模型之首，激活参数比例低于3%，在保持模型强大能力的同时有效提升推理效率。能力方面，文心5.0在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出，拥有强大的理解、逻辑、记忆和说服力。在40余项权威基准的综合评测中，其语言与多模态理解能力与 Gemini-2.5-Pro、GPT-5-High 等模型持平，图像与视频生成能力与垂直领域专精模型相当，达到全球领先水平。11月8日，LMArena 大模型竞技场最新排名显示，文心模型 ERNIE-5.0-Preview-1022在文本任务评测中位列全球并列第二、中国第一，尤其在创意写作、复杂问题理解等方面表现突出。

文心5.0从跑分看能力并不突出，但多模态理解的能力则较为突出。目前海外大厂中Gemini在视频理解上布局较快，其他如OpenAI的GPT-4o单次只能理解音频或视频；国内大厂亦推出了部分视频理解模型，但尚未集成至统一的大模型之中。多模态理解能力有助于囊括更丰富的数据语料，帮助模型不断迭代，践行李彦宏 “智能本身是最大的应用，而技术迭代速度是唯一护城河”的发展思路。

Kimi：Kimi k2 Thinking于11月6日正式发布，在人类最后的考试（HLE）、自主网络浏览能力（BrowseComp）、复杂信息收集推理（SEAL-0）等多项基准测试中表现达到 SOTA 水平，并在 Agentic 搜索、Agentic 编程、写作和综合推理能力等方面取得全面提升。具体而言，Kimi k2 Thinking共1TB参数，激活32B，采用INT4精度（对推理硬件的兼容性更强，对国产加速计算芯片更友好），支持256K上下文窗口，训练成本仅460万美元（CNBC，杨植麟后在社媒否认，称训练成本很难量化，系大部分用于研究和实验）。

Kimi团队在Reddit的回复也透露出了更多信息：1）受模型的“长链式推理机制”影响，k2 Thinking推理效果好但回复慢，后续将进一步优化token效率。2）当前k2 Thinking模型的“人性张力”不足，未来版本可能在情绪表达上更开放、更真实。

Kimi k2 Thinking继MiniMax-M2后再次拿下开源模型宝座的位置，进一步反映国产模型迭代加速趋势。k2 Thinking后续同样会在token效率、情感表达上进一步优化，验证模型工程化重要性。

MiniMax：10月27日，MiniMax正式开源并上线了专为 Agent 和代码而生的MiniMax M2模型，发布时Artificial Analysis (AA)的测评中取得全球第五、开源第一的成绩。M2模型在使用工具和深度搜索的能力都非常接近了海外最好的模型，在编程上逊色于海外最好的模型，但也达到国内最好的一档。此外，M2使用了完全注意力架构，但稀疏程度进一步优化（总参数230B，激活参数量10B），实现定价2.1人民币（0.3美元）每百万输入Token，8.4人民币（1.2美元）每百万输出Token，仅Claude 3.5 Sonnet的8%。

尽管MiniMax-M2只有230B参数量，激活10B，但这为其使用全注意力仍然实现低成本奠定了基础。其将上下文窗口也从前代的100万token缩减至20万，但已能够完成其主攻的智能体和代码任务，并能进一步优化响应速度。总体而言，M2仍然在践行当前模型一贯的迭代方向——更好性能和更低成本，其中注意力机制、Agent、泛化、数据等细节打磨还有较大空间，上述技术方向研究预计将促进模型迭代将进一步加速。

总结：海外GPT-5.1更新围绕效率和个性化升级，国内模型同样加速迭代。百度文心5.0多模态理解能力较为突出，有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首，前者专为 Agent 和代码而生，成本仅为Claude 3.5 Sonnet的8%；后者则将在token效率、情感表达等模型工程化方向不断迭代，优化模型表现。后续凭借国内工程化优势，以及庞大用户群体提供的使用反馈，国产模型及AI应用产品存在赶超海外的基础。

投资建议：国内模型加速突破，工程化为AI落地重要方向。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.