网易首页 > 网易号 > 正文 申请入驻

字节首次开源推理模型,连夺7项第一

0
分享至


智东西
作者 陈骏达
编辑 心缘

智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GPT-5上下文窗口的2倍,相当于1600页文本。


Seed-OSS系列模型是推理模型,专门针对推理任务进行了优化,还允许用户灵活地控制思维预算。

字节Seed团队共开源了Seed-OSS的三个版本,分别为:

(1)基础模型Seed-OSS-36B-Base

(2)无合成数据基础模型Seed-OSS-36B-Base-woSyn

(3)指令微调模型Seed-OSS-36B-Instruct

指令微调后的Seed-OSS-36B-Instruct在通用知识、Agent、编程、长上下文等领域的基准测试中,取得同量级开源模型中的7项SOTA(性能最佳)表现,整体能力超过了Qwen3-32B、Gemma3-27B、gpt-oss-20B等模型,与Qwen3-30B-A3B-Thinking-2507在大部分领域旗鼓相当。


▲基准测试结果,加粗项为开源SOTA(图源:Hugging Face)

Seed-OSS系列模型采用了宽松的Apache2.0开源协议,并会在后续发布模型的详细技术报告。

开源地址:

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct

值得一提的是,字节Seed团队本次的发布方式较为“研究友好”。鉴于在预训练中包含合成指令数据可能会影响后训练研究,无合成数据基础模型的发布,为研究社区提供了更多样化的选择。这一系列模型还支持4位和8位格式的量化,以减少内存需求。

Seed-OSS系列模型使用了12万亿个token的预训练数据,采用当前主流的因果语言模型架构,也就是“预测下一个token”类型的模型。同时,Seed-OSS系列均为稠密模型,没有采用MoE等架构。

这一系列模型结合了几项关键技术,包括RoPE(旋转位置编码)、GQA注意力机制(Grouped Query Attention)、RMSNorm归一化(Root Mean Square Normalization)、SwiGLU激活函数等。这是现代大模型常见的高效组件组合,可提升训练稳定性和推理性能。

Seed-OSS的上下文窗口达512k,相当于能一次性处理数十万字的内容。这一上下文窗口并非后续扩展而来,而是通过原生训练打造的。

思考预算功能可帮助开发者控制模型推理成本,优化使用体验等。字节Seed团队分享了Seed-OSS在不同思考预算下性能的变化情况。

对于更简单的任务(如IFEval),模型的思维链较短,随着思维预算的增加,分数波动并不明显。对于更具挑战性的任务(如AIME和LiveCodeBench),模型的思维链更长,随着思维预算的增加,分数也会提高。


字节Seed团队称,如果没有设置思维预算(默认模式),Seed-OSS将不会拥有任何思考长度限制。

如果指定了思维预算,建议优先考虑512的整数倍值,因为模型已经在这些区间上进行了大量的训练。

当思维预算为0时,模型会直接输出内容,建议将任何低于512的预算设置为0。

Seed-OSS系列模型,获得了不少开发者的认可。Hugging Face的华人工程师Tiezhen Wang评价道,这一系列模型“很适合做消融研究”。这种研究能以较低的成本,探索不同组件对大模型性能的影响。


有网友称,这种尺寸的基础模型在开源界也是比较罕见的,Qwen3就没有公布14B以上的基础模型。另一位网友补充道,长上下文能力对真实应用而言有很大的价值。


结语:从可选项到标配,国产开源模型再添新选项

近期,字节Seed团队已经密集开源了多款模型,除此次的Seed-OSS系列之外,他们还开源了多语言翻译模型Seed-X、智能体模型Tar系列、图像编辑模型Vincie等。

如今,开源已经逐渐从可选项变为近似“标配”的存在,连OpenAI等原本坚持闭源策略的厂商,也在逐步开源模型。字节本次将更为核心的语言模型贡献给社区,给开源社区的后续研究提供了更多基础模型的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蔡琴宁波演唱会赠茅台,目前“茅台票”已售罄

蔡琴宁波演唱会赠茅台,目前“茅台票”已售罄

鲁中晨报
2026-01-15 13:59:12
特朗普“口头降温”,伊朗局势再反转,美曝已收到其政府积极声明

特朗普“口头降温”,伊朗局势再反转,美曝已收到其政府积极声明

铁锤简科
2026-01-15 18:51:12
江苏多地发布去年结婚登记数据

江苏多地发布去年结婚登记数据

扬子晚报
2026-01-15 18:32:02
“小婉君”金铭45岁现状:个子太矮事业受挫,住北京豪宅不婚不育

“小婉君”金铭45岁现状:个子太矮事业受挫,住北京豪宅不婚不育

手工制作阿歼
2026-01-15 11:39:59
特朗普被曝对美可能打击伊朗提要求

特朗普被曝对美可能打击伊朗提要求

参考消息
2026-01-15 18:59:10
中国第一巨人鲍喜顺:不听医生的劝告非要生子,现在儿子长到多高

中国第一巨人鲍喜顺:不听医生的劝告非要生子,现在儿子长到多高

牛牛叨史
2026-01-15 00:15:32
我年终奖60万,我爸只让我带2000块回家,3个月后才知躲过一劫

我年终奖60万,我爸只让我带2000块回家,3个月后才知躲过一劫

墨染尘香
2025-11-07 15:00:25
辽宁人创立的七个国内顶级品牌,看看辽宁哪些地方最出企业家?

辽宁人创立的七个国内顶级品牌,看看辽宁哪些地方最出企业家?

奇思妙想生活家
2026-01-15 03:15:26
两艘一起造?中国第5艘航母来了:不是复制福建舰,而是全面放大

两艘一起造?中国第5艘航母来了:不是复制福建舰,而是全面放大

小小科普员
2026-01-14 14:28:12
事业巅峰远赴美国,被老外“玩腻”后晚年回国,如今变成了这样!

事业巅峰远赴美国,被老外“玩腻”后晚年回国,如今变成了这样!

归史
2025-12-09 11:10:44
痛心!河南帅哥小张去世,仅25,因母亲病重公司不批假想不开跳楼

痛心!河南帅哥小张去世,仅25,因母亲病重公司不批假想不开跳楼

鋭娱之乐
2026-01-14 08:52:03
出大事了,高市闭门不出,和韩总统意外“谈崩”,特朗普急的打转

出大事了,高市闭门不出,和韩总统意外“谈崩”,特朗普急的打转

生活魔术专家
2026-01-14 15:29:40
最新:委内瑞拉恢复原油出口

最新:委内瑞拉恢复原油出口

参考消息
2026-01-14 20:24:42
数千万波斯人,不伺候阿塞拜疆权贵了?伊朗今夜,就是百年前清末

数千万波斯人,不伺候阿塞拜疆权贵了?伊朗今夜,就是百年前清末

南宗历史
2026-01-10 16:15:24
巴萨国王杯大名单:坎塞洛入选,亚马尔、莱万、拉菲尼亚在列

巴萨国王杯大名单:坎塞洛入选,亚马尔、莱万、拉菲尼亚在列

懂球帝
2026-01-15 17:55:07
CBA前14轮战罢,最令人失望的球队,莫过于以下四支

CBA前14轮战罢,最令人失望的球队,莫过于以下四支

过期少女致幻录
2026-01-15 18:44:43
底层人,无利不起早;中层人,有利让三分;上层人,利人才利己

底层人,无利不起早;中层人,有利让三分;上层人,利人才利己

诗词中国
2026-01-07 18:45:30
新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

医护健康科普
2025-08-31 17:07:58
美国与中国大陆将协议两岸统一!

美国与中国大陆将协议两岸统一!

雪中风车
2026-01-13 20:33:50
特朗普开始下令,美军方选边站,美共和党再次内讧?俄军凌晨出动

特朗普开始下令,美军方选边站,美共和党再次内讧?俄军凌晨出动

小冠说娱
2026-01-15 18:20:48
2026-01-15 19:36:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11079文章数 116942关注度
往期回顾 全部

科技要闻

阿里最狠的一次“自我革命”

头条要闻

美方就伊朗局势密集发声 专家:动武的后果将十分严重

头条要闻

美方就伊朗局势密集发声 专家:动武的后果将十分严重

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

传奇棋圣聂卫平离世,网友集体悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

时尚
艺术
游戏
家居
数码

金工守艺人陈英泽:一锤定音,锻出山川意向

艺术要闻

历代书家集字春联大集合

一次性角色:《生化》14年未回归的角色被遗忘了吗?

家居要闻

自在自宅 个性自由

数码要闻

定档1月29日!AMD Ryzen 7 9850X3D发售时间已经确认

无障碍浏览 进入关怀版