网易首页 > 网易号 > 正文 申请入驻

腾讯混元深度思考模型T1正式版来了,吐字快、能秒回,解码速度提升2倍

0
分享至

腾讯混元3月21日周五宣布,正式推出自研深度思考模型混元T1正式版,已在腾讯云官网上线,输入价格为每百万token 1元,输出价格为每百万token 4元。

腾讯混元概括,混元T1正式版的特点为“吐字快、能秒回”、“擅长超长文处理”,称它是腾讯自研的强推理模型。

速度方面,混元T1正式版在可比参数量下的解码性能高于行业2倍,首字秒出,吐字速度每秒60至80token,具备优秀的长文处理能力。多项指标达到业界领先推理模型的水平,效果方面,混元T1正式版逻辑强、文风简洁、复杂指令跟随准确,摘要幻觉低。


通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。

在体现推理模型基础能力的常见评估指标中,如大语言模型(LLM)评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于得分89.3的OpenAI o1,高于得分86.1的OpenAI GPT 4.5和得分84的DeepSeek R1。

在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平,其中,逻辑推理得分93.1,高于前述三个模型o1、GPT 4.5和R1。



混元T1正式版的强大推理能力源于,腾讯沿用混元Turbo S的架构,采用Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。


上述架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本

混元T1在超长文本推理领域也展现出独特优势。

基于出色的长文捕捉能力,混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升2

在上线全新推理模型之前,本周一,腾讯混元模型首次登上了海外权威大模型竞技场 Chatbot Arena 的榜单,跻身全球 Top 15。一同上榜的还有阿里巴巴本月6日发布的通义千问最新开源模型QwQ-32B。


不同于其他测评,Chatbot Arena 的测评人是C端用户——用户在平台上以匿名方式与多个模型互动,然后投票决定哪个模型更好,从而根据分数生成排行榜。这种测评也被看成是大模型直接PK的竞技场,简单直接。

腾讯混元模型在中文基础能力测试中也表现突出。本周二发布的《中文大模型测评基准SuperCLUE 3月报告》中,腾讯混元位列基础模型国内第二,综合实力稳居国内大模型第一梯队。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宗馥莉现身云南昆明小店考察,穿平底半拖鞋个子高,打扮朴素难认

宗馥莉现身云南昆明小店考察,穿平底半拖鞋个子高,打扮朴素难认

晓风说
2025-04-23 22:53:26
突发!华山医院大佬徐启武去世,曾登名医百强榜,死因曝光惹人怜

突发!华山医院大佬徐启武去世,曾登名医百强榜,死因曝光惹人怜

体制内老陈
2025-04-23 15:05:19
2003年的手机价格海报:奇怪当时为啥用两个月工资买一个手机

2003年的手机价格海报:奇怪当时为啥用两个月工资买一个手机

风到腰弯
2025-03-05 09:15:43
国家批复广东规划,打造5个都市圈,“五虎上将”能迎来翻身吗?

国家批复广东规划,打造5个都市圈,“五虎上将”能迎来翻身吗?

我不是博士
2025-04-23 18:25:07
F-117全史:到底什么样的鬼才能想到用这种外形?

F-117全史:到底什么样的鬼才能想到用这种外形?

林子说事
2025-04-23 08:03:36
护盘进入尾声

护盘进入尾声

北京红竹
2025-04-23 15:46:35
双管齐下!《哪吒之魔童闹海》领跑日票房,五一档电影奋力前行!

双管齐下!《哪吒之魔童闹海》领跑日票房,五一档电影奋力前行!

明月聊史
2025-04-23 22:26:24
人老了,不在于运动,不在于喝水,请重视这3条长寿准则!

人老了,不在于运动,不在于喝水,请重视这3条长寿准则!

诗词中国
2025-04-10 13:08:47
哈利伯顿谈与利拉德冲突:没必要装模作样或隐瞒什么,就是互相看不顺眼

哈利伯顿谈与利拉德冲突:没必要装模作样或隐瞒什么,就是互相看不顺眼

雷速体育
2025-04-23 17:35:34
运动员收入榜:乔丹高居第一,罗詹梅分列三到五位,13位篮球运动员跻身前五十

运动员收入榜:乔丹高居第一,罗詹梅分列三到五位,13位篮球运动员跻身前五十

桃叶渡春
2025-04-23 11:28:26
24岁女子因胸太大去缩胸,网友吐槽她浪费好身材:身在福中不知福

24岁女子因胸太大去缩胸,网友吐槽她浪费好身材:身在福中不知福

唐小糖说情感
2025-03-26 10:16:34
特朗普玩砸了!美媒爆料,中方开出3大条件,特朗普称将达成协议

特朗普玩砸了!美媒爆料,中方开出3大条件,特朗普称将达成协议

文史道
2025-04-22 16:05:51
建议“牛仔裤”下面尽量少配运动鞋,瞧杭州、上海这样穿是有多美

建议“牛仔裤”下面尽量少配运动鞋,瞧杭州、上海这样穿是有多美

时尚穿搭生活馆
2024-12-03 23:25:18
贵州省建设投资集团有限公司党委委员、副总经理王伯航接受纪律审查和监察调查

贵州省建设投资集团有限公司党委委员、副总经理王伯航接受纪律审查和监察调查

澎湃新闻
2025-04-23 17:09:05
网逃男子携带70多万元现金“隐居”山洞,白天睡觉,晚上才敢上街购物

网逃男子携带70多万元现金“隐居”山洞,白天睡觉,晚上才敢上街购物

大风新闻
2025-04-22 12:55:09
美国智库警告:中美一旦台海开战,美国将有92%的几率打败解放军

美国智库警告:中美一旦台海开战,美国将有92%的几率打败解放军

车马点兵V
2025-03-31 09:27:33
胡杏儿宁做资本小跟班,也不愿给佘诗曼抬轿?

胡杏儿宁做资本小跟班,也不愿给佘诗曼抬轿?

毒舌八卦
2025-04-23 16:22:37
郭德纲师哥拜访侯耀华,进门先喊一声二爹,双方刚刚签订合作协议

郭德纲师哥拜访侯耀华,进门先喊一声二爹,双方刚刚签订合作协议

轩逸阿II
2025-04-23 15:57:42
为何以前五一放7天,现在却改成五天还得调休,原来都是他的建议

为何以前五一放7天,现在却改成五天还得调休,原来都是他的建议

井普椿的独白
2025-04-23 20:40:18
电池的任督二脉,被钠打通了

电池的任督二脉,被钠打通了

远川研究所
2025-04-23 10:12:11
2025-04-24 02:19:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
128929文章数 2649005关注度
往期回顾 全部

科技要闻

马斯克:中国用户对FSD"最为苛刻"

头条要闻

云南大理州洱源县发生4.8级地震 震源深度10千米

头条要闻

云南大理州洱源县发生4.8级地震 震源深度10千米

体育要闻

金牌和金子,刘国梁改变国乒的这些年

娱乐要闻

于和伟领衔,央视谍战剧要有天花板了

财经要闻

董明珠放话"海归有间谍" 打工人破防了

汽车要闻

以经纬叙事 奇瑞瑞虎新旗舰SUV瑞虎9L快评

态度原创

房产
家居
教育
数码
公开课

房产要闻

疯狂兑现!这个项目,正在革新老黄埔居住天花板!

家居要闻

开阔空间 家居轻智能

教育要闻

蓝色阴影三角形DEG面积为7,求绿色阴影三角形BCE的面积

数码要闻

奥睿科将推出苹果Mac mini 2024扩容机箱设计:最高支持 8TB 存储

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版