网易首页 > 网易号 > 正文 申请入驻

TikTok母公司字节跳动发布开源Seed-OSS-36B模型

0
分享至


TikTok今日再次成为头条新闻,白宫正式入驻这一热门社交媒体平台,而其母公司、中国互联网巨头字节跳动也带来了令人意外的重大发布。

字节跳动旗下Seed团队的AI研究人员今日在AI代码共享网站Hugging Face上发布了Seed-OSS-36B模型。

Seed-OSS-36B是一个全新的开源大语言模型系列,专为高级推理和开发者友好的可用性而设计。该模型拥有更长的Token上下文长度——即模型在单次交互中能够接受和输出的信息量——甚至超过了许多来自美国科技公司的竞争对手,包括OpenAI和Anthropic等行业领导者。

该系列推出了三个主要变体:

**Seed-OSS-36B-Base(含合成数据版本)**

**Seed-OSS-36B-Base(不含合成数据版本)**

**Seed-OSS-36B-Instruct**

Seed团队通过发布Seed-OSS-36B-Base模型的合成数据和非合成数据两个版本,力求在实际性能和研究灵活性之间找到平衡。

含合成数据的变体使用额外的指令数据进行训练,在标准基准测试中始终获得更高分数,旨在作为高性能的通用选择。相比之下,非合成数据模型省略了这些增强功能,创建了更纯净的基础版本,避免了合成指令数据可能引入的偏见或扭曲。

通过提供两个版本,团队为应用用户提供了改进的结果,同时确保研究人员保留了一个中性基线来研究后训练方法。

与此同时,Seed-OSS-36B-Instruct模型的不同之处在于,它通过指令数据进行后训练,优先考虑任务执行和指令遵循,而不是纯粹作为基础模型。

所有三个模型都在Apache-2.0许可证下发布,允许企业的研究人员和开发者免费使用、修改和重新分发。

这意味着它们可以用于驱动商业应用程序,无论是公司内部还是面向外部/客户的应用,都无需向字节跳动支付任何许可费用或应用程序编程接口(API)使用费。

这延续了2025年夏季中国公司发布强大开源模型的趋势,而OpenAI则试图通过本月早些时候发布的自己的开源gpt-oss duet来迎头赶上。

Seed团队将Seed-OSS定位为国际应用,强调在推理、智能体类任务执行和多语言环境中的多功能性。

成立于2023年的Seed团队一直专注于构建能够同时服务于研究和应用用例的基础模型。

**设计和核心特性**

Seed-OSS-36B背后的架构结合了熟悉的设计选择,如因果语言建模、分组查询注意力、SwiGLU激活、RMSNorm和RoPE位置编码。

每个模型在64层中携带360亿个参数,支持155,000个Token的词汇表。

其定义特征之一是原生长上下文能力,最大长度为512,000个Token,旨在处理扩展文档和推理链而不会出现性能损失。

这是OpenAI新GPT-5模型系列长度的两倍,大约相当于1,600页文本,相当于一本基督教圣经的长度。

另一个突出特点是引入了思考预算概念,让开发者可以指定模型在给出答案之前应该进行多少推理。

我们在其他最近的开源模型中也看到了这一点,包括英伟达新推出的Nemotron-Nano-9B-v2,也可在Hugging Face上获得。

在实践中,这意味着团队可以根据任务的复杂性和部署的效率要求来调整性能。

建议预算以512个Token的倍数为单位,0提供直接响应模式。

**第三方基准测试中的竞争性表现**

随版本发布的基准测试将Seed-OSS-36B定位为更强大的大型开源模型之一。特别是Instruct变体,在多个领域都发布了最先进的结果。

**数学和推理**:Seed-OSS-36B-Instruct在AIME24上达到91.7%,在BeyondAIME上达到65分,均代表开源"最先进"(SOTA)水平。

**编程**:在LiveCodeBench v6上,Instruct模型记录了67.4分,这是另一个SOTA分数。

**长上下文处理**:在128K上下文长度的RULER测试中,它达到94.6分,标志着报告的最高开源结果。

**基础模型性能**:含合成数据的Base变体在MMLU-Pro上达到65.1分,在MATH上达到81.7分,均为其类别中的最先进结果。

不含合成数据的Base版本虽然在许多指标上略有落后,但在其自身领域证明了竞争力。它在GPQA-D上超越了其合成数据对应版本,为研究人员提供了更清洁、无指令的实验基线。

对于比较开源选项的企业来说,这些结果表明Seed-OSS在数学密集型、编程和长上下文工作负载方面提供了强大的潜力,同时仍为研究用例提供了灵活性。

**访问和部署**

除了性能之外,Seed团队还强调了对开发者和从业者的可访问性。这些模型可以使用Hugging Face Transformers进行部署,支持4位和8位格式的量化以降低内存需求。

它们还与vLLM集成以实现可扩展服务,包括配置示例和API服务器说明。

为了进一步降低门槛,团队包含了用于推理、提示定制和工具集成的脚本。

对于管理小团队或在预算限制下工作的技术领导者来说,这些条款旨在让360亿参数模型的实验变得更加可行。

**许可和企业决策者的考虑因素**

由于模型在Apache-2.0下提供,组织可以在没有限制性许可条款的情况下采用它们,这对于平衡法律和运营问题的团队来说是一个重要因素。

对于评估开源领域的决策者来说,此次发布带来了三个要点:

在数学、编程和长上下文推理方面的最先进基准测试。

在高性能合成训练模型和清洁研究基线之间的平衡。

为精简工程团队降低运营开销的可访问性功能。

通过在开放许可证下提供强大性能和灵活部署,字节跳动的Seed团队为企业、研究人员和开发者alike增加了新的选择。

Q&A

Q1:Seed-OSS-36B模型有什么特殊之处?

A:Seed-OSS-36B是字节跳动发布的开源大语言模型,拥有512K Token的超长上下文能力,相当于能处理1600页文本,是OpenAI GPT-5的两倍长度。它在数学推理、编程和长文本处理方面都达到了开源模型的最先进水平。

Q2:Seed-OSS-36B有哪些版本可以选择?

A:该模型提供三个版本:含合成数据的Base版本(性能更强)、不含合成数据的Base版本(更纯净的研究基线)、以及Instruct版本(专门优化指令执行)。所有版本都采用Apache-2.0开源许可证,可免费商用。

Q3:企业如何使用Seed-OSS-36B模型?

A:企业可以通过Hugging Face平台获取模型,支持4位和8位量化部署以降低内存需求,还可与vLLM集成实现可扩展服务。由于采用Apache-2.0许可证,企业可以免费用于商业应用而无需支付许可费用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴特勒报销影响:勇士最多落后30分结束4连胜 库里16-40遭打爆

巴特勒报销影响:勇士最多落后30分结束4连胜 库里16-40遭打爆

醉卧浮生
2026-01-21 13:35:08
准备开抢!美媒晒交易市场5条热门大鱼:巴特勒赛季报销影响数人

准备开抢!美媒晒交易市场5条热门大鱼:巴特勒赛季报销影响数人

锅子篮球
2026-01-20 21:33:35
一集比一集上头,Netflix新剧又爆了!连刷全集!

一集比一集上头,Netflix新剧又爆了!连刷全集!

枫尘余往逝
2026-01-21 07:13:46
北京一对夫妻深夜吵架,丈夫放话“不想活了”后离家出走,从五环走到四环,警察:您可真能走,找了您一宿

北京一对夫妻深夜吵架,丈夫放话“不想活了”后离家出走,从五环走到四环,警察:您可真能走,找了您一宿

环球网资讯
2026-01-20 21:13:11
北约盟友集体反水!马克龙拒绝惨遭报复,俄罗斯有人乐了…

北约盟友集体反水!马克龙拒绝惨遭报复,俄罗斯有人乐了…

新财迷
2026-01-21 10:34:12
1971年,毛主席选了党、政、军的接班人,唯有他走到了最后

1971年,毛主席选了党、政、军的接班人,唯有他走到了最后

大运河时空
2026-01-20 18:50:03
特朗普发了张图,加拿大、格陵兰和委内瑞拉都被涂上星条旗!加拿大:已模拟美军事入侵;美财长警告欧洲:不许关税报复

特朗普发了张图,加拿大、格陵兰和委内瑞拉都被涂上星条旗!加拿大:已模拟美军事入侵;美财长警告欧洲:不许关税报复

每日经济新闻
2026-01-20 20:45:09
朝鲜送中国一包草籽当国礼?千万别小看,这包草籽不简单

朝鲜送中国一包草籽当国礼?千万别小看,这包草籽不简单

揽星河的笔记
2026-01-05 20:54:00
拳王邹市明自爆破产,不止赔光2亿,其妻子参加婚礼耍酒疯

拳王邹市明自爆破产,不止赔光2亿,其妻子参加婚礼耍酒疯

说历史的老牢
2026-01-20 14:17:37
亿元大奖没了?中国彩票重磅调整

亿元大奖没了?中国彩票重磅调整

中国新闻周刊
2026-01-20 17:59:16
贝克汉姆说允许孩子犯错,维多利亚与儿媳闹矛盾的画面曝光

贝克汉姆说允许孩子犯错,维多利亚与儿媳闹矛盾的画面曝光

素素娱乐
2026-01-21 08:57:08
221名女囚漂洋过海,下船时全员怀孕,这批女囚竟生出了一个国家

221名女囚漂洋过海,下船时全员怀孕,这批女囚竟生出了一个国家

墨印斋
2026-01-19 12:24:30
又输了!45岁少帅,上任后5胜12负,将季后赛球队,带到了倒数第3

又输了!45岁少帅,上任后5胜12负,将季后赛球队,带到了倒数第3

金山话体育
2026-01-21 09:56:31
脾脏破裂,多根肋骨骨折:卡德罗夫家族危险驾驶早就劣迹斑斑

脾脏破裂,多根肋骨骨折:卡德罗夫家族危险驾驶早就劣迹斑斑

鹰眼Defence
2026-01-20 18:40:19
特朗普通告全球,要打破81年规则,中俄态度明显不同,普京需三思

特朗普通告全球,要打破81年规则,中俄态度明显不同,普京需三思

策略述
2026-01-20 17:13:37
“囤好5天物资,不排除美国入侵”

“囤好5天物资,不排除美国入侵”

观察者网
2026-01-21 13:35:10
流落中国的外国公主,如今拒绝回国:我是中国人,中国就是我的家

流落中国的外国公主,如今拒绝回国:我是中国人,中国就是我的家

鹤羽说个事
2026-01-05 11:05:27
我国5600余个姓氏中只有8个姓氏从未衰落,看一下有你的姓氏吗?

我国5600余个姓氏中只有8个姓氏从未衰落,看一下有你的姓氏吗?

铭记历史呀
2026-01-07 02:22:59
清官难断家务事!88岁老人砸碎小儿子的大门,非要住他家里

清官难断家务事!88岁老人砸碎小儿子的大门,非要住他家里

唐小糖说情感
2026-01-21 10:13:49
广州地铁四期规划,四大郊区的线路预计惨不忍睹!

广州地铁四期规划,四大郊区的线路预计惨不忍睹!

小鬼头体育
2026-01-21 11:10:19
2026-01-21 14:19:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15577文章数 49685关注度
往期回顾 全部

科技要闻

中芯国际等巨头集体提价,8英寸芯片最高涨20%

头条要闻

特朗普:对美国的真正威胁是联合国和北约

头条要闻

特朗普:对美国的真正威胁是联合国和北约

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

李亚鹏2天获1291万网友力挺

财经要闻

消失的投资金 起底华文映像电影投资骗局

汽车要闻

新一代理想L9电池加码体型加大 重夺高端话语权

态度原创

健康
旅游
时尚
艺术
房产

血常规3项异常,是身体警报!

旅游要闻

河南遂平:雪落成诗 邂逅浪漫冬日

告别93岁时尚传奇Valentino:他留下了全世界最美的“红”

艺术要闻

一百多年前的中国,太雄伟震撼了!

房产要闻

那个砸下400亿的绿地,又要杀回海南了!

无障碍浏览 进入关怀版