网易首页 > 网易号 > 正文 申请入驻

中信建投:全球大模型迭代 看好国内AI加速赶超海外

0
分享至

智通财经APP获悉,中信建投证券发布研报称,海外GPT-5.1更新围绕效率和个性化升级,国内模型同样加速迭代。百度(09888)文心5.0多模态理解能力较为突出,有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首,前者专为 Agent 和代码而生,成本仅为Claude 3.5 Sonnet的8%;后者则将在token效率、情感表达等模型工程化方向不断迭代,优化模型表现。后续凭借国内工程化优势,以及庞大用户群体提供的使用反馈,国产模型及AI应用产品存在赶超海外的基础。

中信建投主要观点如下:

GPT-5.1更新,围绕效率和个性化升级。2025年11月13日,OpenAI发布GPT-5.1,包括GPT-5.1 Instant和GPT-5.1 Thinking两个版本。据OpenAI官方公告,Instant比其前代产品“更热情、更智能,也更善于遵循用户指令”,Thinking则“更容易理解,处理简单任务速度更快,处理复杂任务也更持久”。同时,OpenAI进一步升级GPT的路由能力,使其能根据问题复杂程度精准地调整思考时间。此外,OpenAI还进一步优化了GPT的风格特征设置,目前除默认设置外,还支持专业、友好、直言、古怪、高效、讽刺及书呆子等多种风格。

GPT-5.1相较于OpenAI之前的模型更新更注重用户偏好的提升(指令遵循、高效路由和风格预设),这意味着OpenAI也开始注重模型的工程化。当前全球头部模型能力基本满足大多通用场景需求,通过工程化提高效率和体验成为了各厂商亟待重视的方向。


国内模型加速突破,能力较国际前沿进一步看齐。近期国内模型加速迭代,开源模型榜首多次易主,进一步反映国内AI领域已逐步向海外前沿靠拢。后续凭借国内工程化优势,以及庞大用户群体提供的使用反馈,国产模型及AI应用产品存在赶超海外的基础。

百度:11月13日,文心5.0于2025百度世界大会发布,其采用原生全模态统一建模,支持文本、图像、音频、视频等多种信息的联合输入与输出,实现了原生的全模态统一理解与生成。在总参数规模上,文心 5.0 达到了系列最高的2.4万亿,并位列业界已公开模型之首,激活参数比例低于3%,在保持模型强大能力的同时有效提升推理效率。能力方面,文心5.0在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。在40余项权威基准的综合评测中,其语言与多模态理解能力与 Gemini-2.5-Pro、GPT-5-High 等模型持平,图像与视频生成能力与垂直领域专精模型相当,达到全球领先水平。11月8日,LMArena 大模型竞技场最新排名显示,文心模型 ERNIE-5.0-Preview-1022在文本任务评测中位列全球并列第二、中国第一,尤其在创意写作、复杂问题理解等方面表现突出。

文心5.0从跑分看能力并不突出,但多模态理解的能力则较为突出。目前海外大厂中Gemini在视频理解上布局较快,其他如OpenAI的GPT-4o单次只能理解音频或视频;国内大厂亦推出了部分视频理解模型,但尚未集成至统一的大模型之中。多模态理解能力有助于囊括更丰富的数据语料,帮助模型不断迭代,践行李彦宏 “智能本身是最大的应用,而技术迭代速度是唯一护城河”的发展思路。


Kimi:Kimi k2 Thinking于11月6日正式发布,在人类最后的考试(HLE)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中表现达到 SOTA 水平,并在 Agentic 搜索、Agentic 编程、写作和综合推理能力等方面取得全面提升。具体而言,Kimi k2 Thinking共1TB参数,激活32B,采用INT4精度(对推理硬件的兼容性更强,对国产加速计算芯片更友好),支持256K上下文窗口,训练成本仅460万美元(CNBC,杨植麟后在社媒否认,称训练成本很难量化,系大部分用于研究和实验)。

Kimi团队在Reddit的回复也透露出了更多信息:1)受模型的“长链式推理机制”影响,k2 Thinking推理效果好但回复慢,后续将进一步优化token效率。2)当前k2 Thinking模型的“人性张力”不足,未来版本可能在情绪表达上更开放、更真实。

Kimi k2 Thinking继MiniMax-M2后再次拿下开源模型宝座的位置,进一步反映国产模型迭代加速趋势。k2 Thinking后续同样会在token效率、情感表达上进一步优化,验证模型工程化重要性。


MiniMax:10月27日,MiniMax正式开源并上线了专为 Agent 和代码而生的MiniMax M2模型,发布时Artificial Analysis (AA)的测评中取得全球第五、开源第一的成绩。M2模型在使用工具和深度搜索的能力都非常接近了海外最好的模型,在编程上逊色于海外最好的模型,但也达到国内最好的一档。此外,M2使用了完全注意力架构,但稀疏程度进一步优化(总参数230B,激活参数量10B),实现定价2.1人民币(0.3美元)每百万输入Token,8.4人民币(1.2美元)每百万输出Token,仅Claude 3.5 Sonnet的8%。


尽管MiniMax-M2只有230B参数量,激活10B,但这为其使用全注意力仍然实现低成本奠定了基础。其将上下文窗口也从前代的100万token缩减至20万,但已能够完成其主攻的智能体和代码任务,并能进一步优化响应速度。总体而言,M2仍然在践行当前模型一贯的迭代方向——更好性能和更低成本,其中注意力机制、Agent、泛化、数据等细节打磨还有较大空间,上述技术方向研究预计将促进模型迭代将进一步加速。

总结:海外GPT-5.1更新围绕效率和个性化升级,国内模型同样加速迭代。百度文心5.0多模态理解能力较为突出,有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首,前者专为 Agent 和代码而生,成本仅为Claude 3.5 Sonnet的8%;后者则将在token效率、情感表达等模型工程化方向不断迭代,优化模型表现。后续凭借国内工程化优势,以及庞大用户群体提供的使用反馈,国产模型及AI应用产品存在赶超海外的基础。

投资建议:国内模型加速突破,工程化为AI落地重要方向。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
申京30+11+绝平!杜兰特35+6统治加时,阿门躺赢,谢泼德该进首发

申京30+11+绝平!杜兰特35+6统治加时,阿门躺赢,谢泼德该进首发

你的篮球频道
2025-11-17 11:04:31
两个小药丸儿,一个助硬,一个延时长,在家门口的药店就能买到

两个小药丸儿,一个助硬,一个延时长,在家门口的药店就能买到

中医陈旺医生
2025-11-14 10:43:05
带库里格林躺赢?勇士两小将虐菜无敌,三分大队重出江湖

带库里格林躺赢?勇士两小将虐菜无敌,三分大队重出江湖

谢说篮球
2025-11-17 12:20:50
注意,多地运管与保险公司共享数据,私家车别跑网约车了!

注意,多地运管与保险公司共享数据,私家车别跑网约车了!

网约车焦点
2025-11-17 11:41:48
止步于连续9场!约基奇的NBA纪录就此中断

止步于连续9场!约基奇的NBA纪录就此中断

篮球大视野
2025-11-16 16:41:05
泰王夫妇在北京参观灵光寺!苏提达王后穿古韵连衣裙,踩高跟跪拜

泰王夫妇在北京参观灵光寺!苏提达王后穿古韵连衣裙,踩高跟跪拜

小鬼头体育
2025-11-17 11:21:00
新疆男篮!为何没有参加全运会?

新疆男篮!为何没有参加全运会?

篮球大陆
2025-11-17 08:55:59
你做过最疯狂的事是什么?网友:在公园亲了一小时

你做过最疯狂的事是什么?网友:在公园亲了一小时

解读热点事件
2025-10-11 00:20:03
贝林厄姆终于首发,下场后又被图赫尔教训了

贝林厄姆终于首发,下场后又被图赫尔教训了

体坛周报
2025-11-17 11:54:22
我年薪782万,每月给妹妹3万,家宴上妹夫说:哥,下月起给80万

我年薪782万,每月给妹妹3万,家宴上妹夫说:哥,下月起给80万

星宇共鸣
2025-11-13 17:49:13
我精子检查为0已8年,40岁妻子怀孕,我没闹,看到检查结果却懵了

我精子检查为0已8年,40岁妻子怀孕,我没闹,看到检查结果却懵了

真实档案
2025-11-11 17:36:55
将于下周回国?贾跃亭称将加速清偿中国法下债务

将于下周回国?贾跃亭称将加速清偿中国法下债务

PChome电脑之家
2025-11-17 12:16:17
韩日又一合作被叫停

韩日又一合作被叫停

观察者网
2025-11-17 10:59:02
周总理弥留之际“违规”见一个人,嘱咐他:台湾有两个人不能忘!

周总理弥留之际“违规”见一个人,嘱咐他:台湾有两个人不能忘!

浩渺青史
2025-11-14 20:27:05
央媒发文,64岁刘德华高调官宣喜讯,全网恭喜,终于等到这一刻

央媒发文,64岁刘德华高调官宣喜讯,全网恭喜,终于等到这一刻

东方不败然多多
2025-11-16 11:30:48
是时候说出真相!打越南时损失或超乎想象,从牺牲的名将后代便知

是时候说出真相!打越南时损失或超乎想象,从牺牲的名将后代便知

历史茶坊
2025-11-15 13:10:21
摆向阳任河南省民宗委党组书记、省委统战部副部长

摆向阳任河南省民宗委党组书记、省委统战部副部长

中国经济网
2025-11-17 10:18:14
华为Mate80将于25日发布,麒麟9030好极、机背是“∞”

华为Mate80将于25日发布,麒麟9030好极、机背是“∞”

叮当当科技
2025-11-17 11:17:06
德财长访华强调“要对话”

德财长访华强调“要对话”

环球时报国际
2025-11-17 09:55:48
金价大跳水!国际国内齐下跌,投资或刚需者现在该如何抉择?

金价大跳水!国际国内齐下跌,投资或刚需者现在该如何抉择?

三农老历
2025-11-17 10:40:25
2025-11-17 13:32:49
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1063681文章数 101206关注度
往期回顾 全部

科技要闻

营销话术反噬信任,雷军不该只是一怒了之

头条要闻

媒体:沈伯洋如果被抓最高或被判死刑 成为"台独烈士"

头条要闻

媒体:沈伯洋如果被抓最高或被判死刑 成为"台独烈士"

体育要闻

3年没踢球,他想完成“史上最难”的复出

娱乐要闻

二次封后的宋佳凭什么狂妄?

财经要闻

疯狂的"吸金村":村民大肆盗采地下水

汽车要闻

荣威M7+豆包大模型 用车机AI策划说车视频怎么样?

态度原创

教育
家居
艺术
手机
旅游

教育要闻

慈母多败儿 !穷家富养,初中生的一双球鞋2600块

家居要闻

回廊通道 强化空间秩序

艺术要闻

这雪景,太美了!

手机要闻

华为Mate 80手机全系配色公布,标准版有望首搭3D人脸识别

旅游要闻

新疆天山天池雪后初晴 宛若一幅天然水墨画

无障碍浏览 进入关怀版