网易首页 > 网易号 > 正文 申请入驻

新浪微博发布其首个开源大模型 VibeThinker-1.5B

0
分享至

IT之家 11 月 13 日消息,今日新浪微博发布了其首个开源大模型 VibeThinker-1.5B,号称“小模型也可以有大智慧”。

IT之家附官方介绍如下:

目前业界最强大模型参数量大都超过了 1T,甚至出现了 2T 规模的模型,是否只有巨量参数模型才有高度的智能?是否只有少量科技巨头才有能力做大模型?

VibeThinker-1.5B,正是微博 AI 对此问题给出的否定答案,它证明了小模型也可以有高智商。这意味着做最强大模型不再像传统观念以为的那样主要依赖推高参数量,也可以通过巧妙的算法设计来做到这一点。

这款模型仅有 1.5B (15 亿) 参数,经过微博 AI 研发人员提出的创新“频谱到信号原理”(SSP)方法训练后,其效果堪称颠覆:VibeThinker 在 AIME24、AIME25 以及 HMMT25 三个高难度数学测试集上的表现,超越了参数量超其 400 倍的模型 DeepSeek-R1-0120 版本(模型大小 671B),与规模为 456B 的 MiniMax-M1 效果接近或相当;在 LiveCodeBench v6(编程算法题测试集)中的成绩,成功追平参数量数超其数十倍的模型,比如欧洲领先 AI 企业 Minstral.AI 的深度思考模型 Magistral-Medium-2506 版本。





VibeThinker 能力强大不靠堆参数,而是源于微博研发人员提出的 SSP 训练理念,即在学习阶段先鼓励模型发散探索所有可能的解题路径,而非一味关注正确率;随后,通过强化学习进行高效策略优化,精准锁定正确路径,将模型性能提升至极致。

模型的单次“后训练”(Post-Training)成本不足 8000 美元,与此对应,DeepSeek-R1 和 MiniMax-M1 的后训练成本分别是 29 万及 53 万美元,降低了几十倍。

VibeThinker-1.5B 的开源,旨在为全球计算资源有限的中型企业及高校研究团队,提供一条高性价比的研发新路径,使得人人都可以训练最前沿的大模型,而不是像之前一样被排斥在外,这对于业界技术进步至关重要。

Github:https://github.com/WeiboAI/VibeThinker

HuggingFace:https://huggingface.co/WeiboAI/VibeThinker-1.5B

Arxiv:https://arxiv.org/pdf/2511.06221

ModelScope:https://www.modelscope.cn/models/WeiboAI/VibeThinker-1.5B

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
正式官宣!20岁杨瀚森再破天花板,这次他让姚明和整个篮坛沉默了

正式官宣!20岁杨瀚森再破天花板,这次他让姚明和整个篮坛沉默了

阿纂看事
2026-01-06 17:14:51
布克赛后摊牌,狄龙接受现实!乌度卡躲过一劫,杜兰特力证一事实

布克赛后摊牌,狄龙接受现实!乌度卡躲过一劫,杜兰特力证一事实

鱼崖大话篮球
2026-01-06 17:48:39
美联储,降息大消息!金银又疯狂了!

美联储,降息大消息!金银又疯狂了!

中国商界杂志社
2026-01-06 15:16:40
西工大立大功!全世界都没想到,中国技术居然再次“弯道超车”

西工大立大功!全世界都没想到,中国技术居然再次“弯道超车”

八斗小先生
2026-01-05 10:39:31
风向不对!网上现大量“美国只斩首,不伤平民”言论,值得警惕

风向不对!网上现大量“美国只斩首,不伤平民”言论,值得警惕

消失的电波
2026-01-06 14:11:46
中国禁枪的真正原因是啥?网友:不禁掉,中国街上天天真人cs

中国禁枪的真正原因是啥?网友:不禁掉,中国街上天天真人cs

带你感受人间冷暖
2026-01-04 00:20:04
广东传来3大隐患和3好消息!排名没掉,强援将复出,杜锋更有底了

广东传来3大隐患和3好消息!排名没掉,强援将复出,杜锋更有底了

后仰大风车
2026-01-06 07:10:05
对越反击战期间,先前有 15 个国家明确站队支持越南,然而战争正式打响后,它们却不约而同地选择了缄口不言,这是为何?

对越反击战期间,先前有 15 个国家明确站队支持越南,然而战争正式打响后,它们却不约而同地选择了缄口不言,这是为何?

史海孤雁
2025-12-19 17:46:17
今晚打响!U23亚洲杯正式揭幕 昔日5大球星有人成欧冠冠军

今晚打响!U23亚洲杯正式揭幕 昔日5大球星有人成欧冠冠军

新英体育
2026-01-06 11:01:00
洪森最大的失误:低估了西哈莫尼国王,高估了儿子洪玛奈!

洪森最大的失误:低估了西哈莫尼国王,高估了儿子洪玛奈!

阿柒的讯
2025-12-23 18:22:55
演员闫学晶陷舆论争议 儿子首发声:网上所有的回应都不实

演员闫学晶陷舆论争议 儿子首发声:网上所有的回应都不实

红星新闻
2026-01-06 20:18:24
中国财政供养人员达6846万?结构失衡才是财政压力的核心

中国财政供养人员达6846万?结构失衡才是财政压力的核心

流苏晚晴
2025-12-04 19:27:08
“商业航天第一股”要来了,近10家上市公司披露参股蓝箭航天

“商业航天第一股”要来了,近10家上市公司披露参股蓝箭航天

瑞财经
2026-01-06 18:17:10
宋朝之前连棉被都没有,零下几十度的寒冬,古人是怎么熬过去的?

宋朝之前连棉被都没有,零下几十度的寒冬,古人是怎么熬过去的?

妙知
2026-01-06 17:06:49
司晓迪风波再升级!晒出开房记录以证真实,男明星的澄清漏洞百出

司晓迪风波再升级!晒出开房记录以证真实,男明星的澄清漏洞百出

巧手晓厨娘
2026-01-06 20:25:24
大爆发!林葳23+5+6三分创多项留洋新高 持平对手全队三分命中数

大爆发!林葳23+5+6三分创多项留洋新高 持平对手全队三分命中数

醉卧浮生
2026-01-06 10:21:28
韩国大胆提议:建设首尔至北京高铁,但有一个条件,中方须先答应

韩国大胆提议:建设首尔至北京高铁,但有一个条件,中方须先答应

糖逗在娱乐
2026-01-06 08:10:03
吉林省辽源市人大常委会党组副书记王军接受审查调查

吉林省辽源市人大常委会党组副书记王军接受审查调查

界面新闻
2026-01-06 15:34:56
皇马遭重击!姆巴佩确认无缘西超杯战马竞 阿隆索输球或被原地解雇

皇马遭重击!姆巴佩确认无缘西超杯战马竞 阿隆索输球或被原地解雇

风过乡
2026-01-06 19:32:42
委内瑞拉全国“抓内鬼”

委内瑞拉全国“抓内鬼”

每日经济新闻
2026-01-06 13:03:13
2026-01-06 21:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
323196文章数 606863关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

媒体:遭美袭击后第三天 委局势进入关键阶段

头条要闻

媒体:遭美袭击后第三天 委局势进入关键阶段

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

亲子
手机
本地
数码
公开课

亲子要闻

看了上海张柏芝的家,无数宝妈酸了:这才是拼三胎的基本条件!

手机要闻

小米17 Max再次被确认:8000mAh+3D超声波+金属中框,参数全揭秘

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

数码要闻

惠普HyperX CES 2026推出四款键盘,霍尔磁性、机械、薄膜轴体

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版