网易首页 > 网易号 > 正文 申请入驻

野生DeepSeek火了,速度碾压官方版,权重开源

0
分享至

机器之心报道

编辑:杜伟、泽南

没等来 DeepSeek 官方的 R2,却迎来了一个速度更快、性能不弱于 R1 的「野生」变体!

这两天,一个名为「DeepSeek R1T2」的模型火了!

这个模型的速度比 R1-0528 快 200%,比 R1 快 20%。除了速度上的显著优势,它在 GPQA Diamond(专家级推理能力问答基准)和 AIME 24(数学推理基准)上的表现均优于 R1,但未达到 R1-0528 的水平。

在技术层面,采用了专家组合(Assembly of Experts,AoE)技术开发,并融合了 DeepSeek 官方的 V3、R1 和 R1-0528 三大模型。

当然,这个模型也是开源的,遵循 MIT 协议,并在 Hugging Face 上开放了权重。

Hugging Face 地址:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera

经过进一步了解,我们发现:DeepSeek R1T2 是德国一家 AI 咨询公司「TNG」推出的,模型全称为「DeepSeek-TNG R1T2 Chimera」(以下简称 R1T2)。

该模型除了前文提到的在智力水平和输出效率之间实现完美平衡之外,相较于这家公司的初代模型「R1T Chimera」,智力大幅跃升,并实现了突破性的 think-token 一致性。

不仅如此,即使在没有任何系统提示的情况下,该模型也能表现稳定,提供自然的对话交互体验。

在评论区,有人误以为这个模型出自 DeepSeek 官方,并且认为他们是不是也在走相同的路线:给模型起各种名称,就是不用主系列下一代版本号?

更多的人认可该模型「找到了智能与输出 token 长度之间的最佳平衡点,并且提升了速度」,并对该模型在现实世界的表现充满了期待。

模型细节概览

从 Hugging Face 主页来看,R1T2 是一个基于 DeepSeek R1-0528、R1 以及 V3-0324 模型构建的 AoE Chimera 模型。

该模型是一个采用 DeepSeek-MoE Transformer 架构的大语言模型,参数规模为 671B。

R1T2 是该公司 4 月 26 日发布的初代模型「R1T Chimera」的首个迭代版本。相较于利用双基模型(V3-0324 + R1)的初代架构,本次升级到了三心智(Tri-Mind)融合架构,新增基模型 R1-0528。

该模型采用 AoE 技术构建,过程中利用较高精度的直接脑区编辑(direct brain edits)实现。这种精密融合不仅带来全方位提升,更彻底解决了初代 R1T 的

token 一致性缺陷。

团队表示,R1T2 对比其他模型具备如下优劣:

  • 与 DeepSeek R1 对比:R1T2 有望成为 R1 的理想替代品,两者几乎可以通用,并且 R1T2 性能更佳,可直接替换。
  • 与 R1-0528 对比:如果不需要达到 0528 级别的最高智能,R1T2 相比之下更加经济。
  • 与 R1T 对比:通常更建议使用 R1T2,除非 R1T 的特定人格是最佳选择、思考 token 问题不重要,或者极度需求速度。
  • 与 DeepSeek V3-0324 对比:V3 速度更快,如果不太关注智能可以选择 V3;但是,如果需要推理能力,R1T2 是首选。

此外,R1T2 的几点局限性表现在:

  • R1-0528 虽推理耗时更长,但在高难度基准测试中仍优于 R1T2;
  • 经 SpeechMap.ai(由 xlr8harder 提供)测评,R1T2 应答克制度(reserved)显著高于 R1T,但低于 R1-0528;
  • 暂不支持函数调用:受 R1 基模型影响,现阶段不推荐函数调用密集型场景(后续版本可能修复);
  • 基准测试变更说明:开发版由 AIME24+MT-Bench 变更为 AIME24/25+GPQA-Diamond 测评体系,新体系下 R1 与初代 R1T 的分差较早期公布数据更大。

最后,关于 R1T2 中重要的 AoE 技术,可以参考以下论文。

  • 论文标题:Assembly of Experts: Linear-time construction of the Chimera LLM variants with emergent and adaptable behaviors
  • 论文地址:https://arxiv.org/pdf/2506.14794

参考链接:https://x.com/tngtech/status/1940531045432283412

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
震惊了!坐飞机,发现了一名超像豆包的空姐

震惊了!坐飞机,发现了一名超像豆包的空姐

微微热评
2026-06-25 12:35:51
甘当美国木偶!冯德莱恩对华摊牌,宁烧3600亿也要强断中欧合作

甘当美国木偶!冯德莱恩对华摊牌,宁烧3600亿也要强断中欧合作

流史岁月
2026-06-25 21:40:56
“无知母亲,毁掉了儿子的饭碗”,母亲在业主群立规矩,反被举报

“无知母亲,毁掉了儿子的饭碗”,母亲在业主群立规矩,反被举报

妍妍教育日记
2026-06-24 10:57:13
67岁王朔现状:一身毛病,爱吃甜食,独自定居北京,拒绝综艺商演

67岁王朔现状:一身毛病,爱吃甜食,独自定居北京,拒绝综艺商演

白面书誏
2026-06-25 18:37:27
全红婵留长发,近170cm颜值惊人,网友:这脸,变化好大

全红婵留长发,近170cm颜值惊人,网友:这脸,变化好大

新动察
2026-06-24 08:54:19
身价暴涨66倍!20岁瑞士新星比肩穆勒姆巴佩,刷新世界杯又一纪录

身价暴涨66倍!20岁瑞士新星比肩穆勒姆巴佩,刷新世界杯又一纪录

体坛老球迷
2026-06-25 16:32:47
2换8交易达成!NBA历史最大特例诞生!三球联手华子

2换8交易达成!NBA历史最大特例诞生!三球联手华子

世界体育圈
2026-06-25 22:35:25
旅居东京三个月彻底悟透:日本遍地没早餐店,根本不是没钱没人做

旅居东京三个月彻底悟透:日本遍地没早餐店,根本不是没钱没人做

老特有话说
2026-06-24 15:07:56
16岁女生举报江西财大男学生:被PUA控制,强迫性关系,细节披露

16岁女生举报江西财大男学生:被PUA控制,强迫性关系,细节披露

李晚书
2026-06-25 19:08:55
3场3助攻!巴西28岁中场大师创队史60年神迹:辅佐维尼修斯冲冠

3场3助攻!巴西28岁中场大师创队史60年神迹:辅佐维尼修斯冲冠

李喜林篮球绝杀
2026-06-25 16:19:40
随着巴西3-0苏格兰,日本进退两难!想进世界杯8强,可能末轮放水

随着巴西3-0苏格兰,日本进退两难!想进世界杯8强,可能末轮放水

侃球熊弟
2026-06-25 08:04:38
加纳巫医:我非常喜欢凯恩,打算给孩子取名哈里-凯恩

加纳巫医:我非常喜欢凯恩,打算给孩子取名哈里-凯恩

懂球帝
2026-06-25 21:05:07
佛得角门将战靴产自中国莆田,代工厂负责人:世界杯前国外客户下的紧急订单,海外售价约1500至1700元人民币,暂未在国内销售

佛得角门将战靴产自中国莆田,代工厂负责人:世界杯前国外客户下的紧急订单,海外售价约1500至1700元人民币,暂未在国内销售

大象新闻
2026-06-25 17:57:03
重磅!美国就俄乌战争作出公开表态!白俄对乌打开边境

重磅!美国就俄乌战争作出公开表态!白俄对乌打开边境

史政先锋
2026-06-25 20:58:05
零跑"神车"官宣:6月25日,正式上市

零跑"神车"官宣:6月25日,正式上市

科技堡垒
2026-06-25 10:20:07
门店全部关闭!欠款上亿!“后续也不会再开”!昔日行业巨头再爆雷,多方发声

门店全部关闭!欠款上亿!“后续也不会再开”!昔日行业巨头再爆雷,多方发声

南方都市报
2026-06-25 09:22:01
梅西宣布2030年世界杯计划,阿根廷传奇想以圆满战绩结束职业生涯

梅西宣布2030年世界杯计划,阿根廷传奇想以圆满战绩结束职业生涯

夜白侃球
2026-06-25 09:50:36
打平即出线,韩国输掉了:孙兴慜?李刚仁?

打平即出线,韩国输掉了:孙兴慜?李刚仁?

张佳玮写字的地方
2026-06-25 12:08:37
美女法官的“赤脚秀” 为何引来群嘲

美女法官的“赤脚秀” 为何引来群嘲

宾语观世
2026-06-25 19:56:53
692分!独家专访高考同分姐妹花:打篮球解压,没上过培优班

692分!独家专访高考同分姐妹花:打篮球解压,没上过培优班

极目新闻
2026-06-25 22:41:54
2026-06-25 23:11:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13360文章数 142682关注度
往期回顾 全部

科技要闻

存储成本压力山大!苹果罕见全球提价

头条要闻

33岁男子赴泰考察后失联 曾打电话给妻子称"被人按着"

头条要闻

33岁男子赴泰考察后失联 曾打电话给妻子称"被人按着"

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

一汽-大众迈腾PHEV、探岳L PHEV双车上市 16.99万起

态度原创

时尚
本地
教育
房产
公开课

今年夏天最流行的阔腿裤,配这5双鞋时髦又松弛

本地新闻

2026世界杯全勤太难?这份保姆级攻略请收好

教育要闻

收藏!2026全国31省高考志愿填报时间最全汇总,错过一天等一年!

房产要闻

城市精英集体出手!科学城这一现象级热销红盘,凭何成为共识之选?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版