网易首页 > 网易号 > 正文 申请入驻

腾讯推出「快思考」:API 成本只有 DeepSeek 不到一半

0
分享至

AI新浪潮观察

6min read

腾讯推出「快思考」:API 成本只有 DeepSeek 不到一半

连然2025/03/03

摘要

再探超大规模MoE性能和成本极限?

最近,腾讯元宝可以说是「杀疯了」,先是多款产品接入deepseek,推出自研混元T1模型,又是猛推流,一度超越字节"豆包"登顶中国区App Store免费榜第二,又是入驻微信生活服务“九宫格”。

在各家大模型纷纷推出深度思考模型的同时,腾讯混元又「反常」地推了一个快思考模型Turbo S。

2月27日,腾讯混元自研的快思考模型Turbo S正式发布,目前已在腾讯云和元宝上线。

区别于Deepseek R1、混元T1等需要“想一下再回复”的慢思考模型,混元Turbo S能够实现“秒回”,吐字速度提升一倍,首字时延降低44%,同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。

有研究表明,人类约90%—95%的日常决策依赖直觉,快思考正如人的“直觉”,为大模型提供了通用场景下的快速响应能力,而慢思考更像理性思维,通过分析逻辑提供解决问题思路。快思考和慢思考的结合和补充,可以让大模型更智能、更高效地解决问题。

据介绍,通过长短思维链融合,腾讯混元Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,显著改进了理科推理能力,实现模型整体效果提升。

作为旗舰模型,Turbo S未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。

基于Turbo S,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型 T1,该模型已在腾讯元宝上线,用户可以选择Deepseek R1 或腾讯混元T1模型进行回答,具体操作上,在元宝中选择 Hunyuan 模型,点亮 T1 即为深度思考,不点亮则为 Turbo S。

开发者和企业用户已经可以在腾讯云上通过API调用腾讯混元Turbo S,即日起一周内免费试用。定价上,Turbo S 输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相比前代混元Turbo模型价格下降数倍,是deepseek API成本的 1/2-1/4,团队称「比大模型界的拼多多还便宜」。另外,混元满血T1 将在3月初发布。

在3月2日腾讯混元的直播里,腾讯混元专家团队对这次推出的快思考模型做出了详解,极客公园整理重点如下:


为什么要做「快思考」?

团队通过分析和观察发现,用户约 90% 的请求都可以依靠大模型的 “直觉”(即快思考模型),无需深度思考就能精准简洁地给出答案,所以针对这些请求需要模型能更快、更准地回应。

对于剩下的约 10% 的请求,需要模型能进行深度思考甚至反思,从而给出更精准的答案。

同时,快思考模型不仅成本更低,还具备强大的数据融合能力,能够融入 MySQL 模型或 Max 模型中的优质数据。

Turbo S 借鉴了腾讯的慢思考模型 Hunyuan T1 的数据,该模型使用一种称为长思维链合成的技术进行训练。这有助于 Turbo S 在保持其速度优势的同时,通过多步骤问题进行推理,使得对于其余 10% 需要反复反思思考的问题也能得到较精准答案。


技术解析:模型架构/工程优化

在业界通用的多个公开Benchmark上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5等业界领先模型的效果表现。

*表格中,其它模型的评测指标来自官方评测结果,官方评测结果中不包含部分来自混元内部评测平台

架构方面,通过创新性地采用了Hybrid-Mamba-Transformer 融合模式,混元Turbo S有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache缓存占用,实现训练和推理成本的下降。

传统 Transformer 架构存在以下缺陷 :

计算复杂度高,序列维度呈平方级关系,在训练和推理时复杂度高;

推理时需要 KV-Cache,且随着序列长度增加线性增加,部署成本高;预测时时间成本高,每步预测因叠加 KV-Cache 与序列长度呈线性关系,越往后生成越慢,尤其对于Mamba 线性 Attention 机制,每步预测都是 O1 复杂度,所以需要做更高效的 attention 或甚至 linear 的 attention,目前行业内已有一些相关探索方案如 window attention、mobile、NSA 等,都是通过不同方式压缩计算复杂度。

Hybrid-Mamba-Transformer 融合架构是混元 Turbo S 中的一项突破性架构创新,通过融合两种强大的架构,平衡效率和上下文推理能力:

Mamba 是一种状态空间模型(SSM),专为高效处理长序列而设计,在内存使用上比 Transformer 更为节省。与 Transformer 不同,后者在处理长文本时会遇到 KV-cache 内存的平方级扩展问题,而 Mamba 可以在不产生过多计算开销的情况下处理更长的文本,更适合阅读、总结和生成长文档的回答(例如法律文本、研究论文等)。

尽管 Mamba 高效,但它在捕捉复杂的上下文关系方面不如 Transformer。Transformer 擅长理解复杂的模式和依赖关系,特别适合推理密集型任务,如数学运算、逻辑推理和问题解决,适用于多步骤推理、代码生成和深度上下文理解。

混元 Turbo S 首次将 Mamba 应用于超大规模 MoE 模型 MoE(专家混合模型)通过每次查询激活一部分参数,从而提高计算效率,在保持精度的同时充分利用了 Mamba 的高效性,同时也保留了 Transformer 在推理任务中的优势。这一突破不仅降低了训练和推理成本,还提升了速度和智能水平。


算法做到了哪些不一样的工作?

长短思维链的融合。

通过长短思维链融合,对于需反复推理反思的问题也能得到更精准答案, T1 模型可得到相对长链数据,将长链数据和短链数据融合训练后采样,采样依据正确性和长度正确性,采用规则方法和滤波 model case ,从而提升模型整体能力,尤其在数学、代码、逻辑等强推理任务上表现更好,且短链模型能很好地融合长链能力,体验更佳。

即短链模型其实体验更佳,通过融合长链也能有很好的推理能力。


scaling law还没结束

GPT-4.5是短链模型天花板的一个存在,但 API 的成本非常高,以百万tokens计算约为150 美元,约是Turbo S 成本 500 倍,且据推测,GPT-4.5的激活参数量达万亿级别。因此,Turbo S等快思考模型的出现,正是为了在保证响应速度的同时,降低成本并保持较好的性能。

目前 scaling 远未结束。从数据量来看,不管是模型 size 的 scaling 还是训练数据的 scaling,现在中文互联网上可获取数据量各家差不多,谁能通过获取或合成方式获得更多数据量对模型 performance 来说是关键。

标注数据方面,更专业标注团队对模型表现影响大,如小说创作、医疗方向等,拥有更专业标注团队和数据的模型表现会更好,整体来看,在数据、算法、算力工程优化等方面对 scaling 的探索都远未结束。

腾讯混元大模型

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
34岁评上副教授,直接躺平15年!山东一教师自曝生活状态,引争议

34岁评上副教授,直接躺平15年!山东一教师自曝生活状态,引争议

火山詩话
2026-02-27 09:09:49
岳云鹏早期有多“卑微”,一张德云社旧相片,与君把酒话当年!

岳云鹏早期有多“卑微”,一张德云社旧相片,与君把酒话当年!

放开他让wo来
2026-02-25 22:52:19
湖南一女子在网吧骚扰男性玩家,涉事网吧回应:一开始以为情侣争吵,了解清楚立即制止了

湖南一女子在网吧骚扰男性玩家,涉事网吧回应:一开始以为情侣争吵,了解清楚立即制止了

大象新闻
2026-02-26 18:53:03
BBA集体 “大跳水”!奥迪跌破10万,宝马降27万...网友:感谢新能源!

BBA集体 “大跳水”!奥迪跌破10万,宝马降27万...网友:感谢新能源!

极果酷玩
2026-02-26 16:49:51
西方打死也想不通:为什么秦始皇死了2000年,中国还在他的布局里

西方打死也想不通:为什么秦始皇死了2000年,中国还在他的布局里

凡人侃史
2026-02-26 15:26:20
沉默整整9天,毛宁一锤定音,中美战机已交手,美方要见中国代表

沉默整整9天,毛宁一锤定音,中美战机已交手,美方要见中国代表

墨兰史书
2026-02-26 18:59:24
中国男篮87-80日本!球员评分:2人满分 3人不及格 最差非余嘉豪

中国男篮87-80日本!球员评分:2人满分 3人不及格 最差非余嘉豪

侃球熊弟
2026-02-26 20:21:29
许家印侄子豪宅拍卖,被苏老板5016万元拍下!房产总面积317平方米,配有5个洗手间

许家印侄子豪宅拍卖,被苏老板5016万元拍下!房产总面积317平方米,配有5个洗手间

每日经济新闻
2026-02-26 22:00:09
紫牛头条|花8800元高价寻宠发现“走失”猫咪还在室内,寻宠团队拒绝退费引纠纷

紫牛头条|花8800元高价寻宠发现“走失”猫咪还在室内,寻宠团队拒绝退费引纠纷

扬子晚报
2026-02-26 23:32:14
对比《供应商行为准则》:苹果165页涵盖方方面面,华为仅7页全是官话

对比《供应商行为准则》:苹果165页涵盖方方面面,华为仅7页全是官话

爆角追踪
2026-02-26 13:51:08
辽宁、甘肃等地接连发生路口多人死伤道路交通事故,公安部交管局提醒

辽宁、甘肃等地接连发生路口多人死伤道路交通事故,公安部交管局提醒

界面新闻
2026-02-27 09:23:31
“沪七条”出炉!一线城市开启抢人大战,你的房子还值钱吗?

“沪七条”出炉!一线城市开启抢人大战,你的房子还值钱吗?

柏年说政经
2026-02-26 17:57:58
现场签约!中方给出重磅见面礼,默茨轻飘飘2句话,断了波音后路

现场签约!中方给出重磅见面礼,默茨轻飘飘2句话,断了波音后路

纪中百大事
2026-02-26 19:59:58
状元梦游库明加17+9+3,双星58分弑杀旧主,老鹰大胜奇才夺3连胜

状元梦游库明加17+9+3,双星58分弑杀旧主,老鹰大胜奇才夺3连胜

钉钉陌上花开
2026-02-27 10:48:58
不装了?FIBA官方竟称中国队偷走一场胜利 媒体人怒斥:无法无天

不装了?FIBA官方竟称中国队偷走一场胜利 媒体人怒斥:无法无天

念洲
2026-02-27 07:49:08
警惕!凡是微信里有钱的、绑银行卡的,今后要多注意了

警惕!凡是微信里有钱的、绑银行卡的,今后要多注意了

冷峻视角下的世界
2026-02-26 22:06:04
曾叫板董明珠,老牌空调巨头倒在春节前

曾叫板董明珠,老牌空调巨头倒在春节前

螺旋实验室
2026-02-25 18:38:13
兄妹服务区捡到4万多元现金和首饰,为等失主错过高速免费时间

兄妹服务区捡到4万多元现金和首饰,为等失主错过高速免费时间

扬子晚报
2026-02-27 07:44:46
这次荷兰没话说了!中方正式宣布:更换国内供应商,从此不再合作

这次荷兰没话说了!中方正式宣布:更换国内供应商,从此不再合作

晓劗就是我
2026-02-26 15:50:07
东北人的宿命:离开东北

东北人的宿命:离开东北

快刀财经
2026-02-25 22:13:17
2026-02-27 11:08:49
极客公园
极客公园
让最棒的创新成为头条
11829文章数 78811关注度
往期回顾 全部

科技要闻

英伟达业绩亮眼仍跌5% 两大因素成核心隐忧

头条要闻

媒体:骄傲十年后 德国不得不正视中国

头条要闻

媒体:骄傲十年后 德国不得不正视中国

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

魅族手机,终成弃子?

汽车要闻

40岁的吉利,不惑于内外

态度原创

本地
亲子
家居
时尚
公开课

本地新闻

津南好·四时总相宜

亲子要闻

越讨厌跑得越远-游戏篇

家居要闻

素色肌理 品意式格调

今年春天最美搭配:西装+半裙,怎么穿都好看!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版