网易首页 > 网易号 > 正文 申请入驻

不怕Claude断供!豆包编程模型来了,5分钟造“我的世界”翻版,花费2毛钱

0
分享至


智东西
作者 陈骏达
编辑 漠影

首款豆包编程模型,来了!

智东西11月11日报道,今天,字节跳动旗下云和AI服务平台火山引擎,发布了豆包大模型家族中的首款编程模型——Doubao-Seed-Code。这是一款专门面向Agentic Coding任务优化的编程模型,并在性价比上实现了突破。

性能方面,在业内多个主流编程测评集中,Doubao-Seed-Code的得分超过了DeepSeek-V3.1、Kimi-K2、GLM-4.6等国产模型,整体表现仅次于当前AI编程领域的顶级模型——Claude Sonnet 4.5。此外,Doubao-Seed-Code拥有原生256K上下文,比Claude Sonnet 4.5的200K上下文还要高。


榜单之外,Doubao-Seed-Code还注重在真实编程场景的落地。得益于其专门面向主流开发工具的优化,无论是Claude Code、Trae还是veCLI的用户,都能轻松上手,并获得稳定的输出效果。

同时,Doubao-Seed-Code是国内首个支持视觉理解能力的编程模型,它可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和Bug修复,大幅提升前端开发效率。

值得一提的是,今天,字节跳动旗下的AI原生IDE产品Trae中国版已经接入了Doubao-Seed-Code模型,Trae+Doubao-Seed-Code的组合,在权威编程基准测试SWE-Bench-Verified中一同登顶SOTA,实现模型+工具的生态闭环。


结合价格后,Doubao-Seed-Code变得更能打了。这一模型采用了分层定价模式,在用户使用最多的0-32K输入区间上,Doubao-Seed-Code的输入价格为1.20元/百万Tokens,输出价格8.00元/百万Tokens。使用全量透明缓存后,模型的使用成本还能再降低80%,综合使用成本降低62.7%


我们在实测时让Doubao-Seed-Code复刻了经典游戏《我的世界》,成本不到2毛钱,画风、游戏体验上都与原版相似,直接可玩。相同tokens量下(0-32k区间),Claude Sonnet 4.5完成任务的成本已经超过3元。


近日,智东西抢先深度体验了Doubao-Seed-Code在真实编程场景里的效用,它不仅能自主规划开发计划、快速搭建前端网页,还能深入数据库进行修改,遇到错误时主动修复、补充注释、优化结构。到这一刻,Doubao-Seed-Code不再只是“写代码的机器”,而是一个能与人并肩思考、共同创造的开发伙伴。

一、无缝接入Claude Code,一张截图就能复刻“抖音”

工具兼容性一直是影响AI编程模型采用的主要因素之一,这次,Doubao-Seed-Code在工具的适配上下足了功夫。Doubao-Seed-Code选择了原生兼容Anthropic API,无需经过任何转换即可直接Claude Code。这意味着广大熟悉Claude Code的开发者,几乎可以不费任何学习成本地将API轻松切换到Doubao-Seed-Code。


火山方舟平台还为Doubao-Seed-Code提供了详细的API调用指南,纯小白用户只需跟着指南一步一步走,就能体验到新模型。

在深度实测Doubao-Seed-Code的开发能力之前,我们先来几道“开胃菜”。

小球弹跳几乎已经成了大模型的必考题。Doubao-Seed-Code打造的小球弹跳不仅符合物理规律,还十分丝滑。同时,模型自主决定新增了一个功能,只要点击小球就可以改变其受力情况,让小球弹跳不再只是无限循环。


我们还测试了模型按照网页截图开发的能力。在上传截图后,Doubao-Seed-Code可以分析页面布局、视觉特点等,然后逐步搭建网页的核心组件。将结果发送给用户前,模型还会进行功能测试,然后再交付成品。


在日常应用场景中,使用Doubao-Seed-Code 开发小工具同样快捷高效。我们尝试输入“生成一个宠物日记 App”,模型便自动搭建App框架、设计组件。


仅需几分钟,模型便交付了可直接使用的成品。从登录界面到图像、文字的上传,都能正常运转。


在开发过程中,我们观察到 Doubao-Seed-Code 遵循“先规划,再开发”的逻辑,并利用深度思考能力对生成结果进行自我分析与优化。当用户需求不够明朗时,模型还能主动梳理需求,甚至提出问题以获取更多信息。

这些特性,成为Doubao-Seed-Code在真实生产环境中部署的重要基础。

二、前后端代码都能写,超大上下文可改生产级代码库

实际上,Doubao-Seed-Code的能力远不止于打造有趣的小程序或网页,它完全可以胜任复杂的一线开发任务。

为了打造更贴合真实使用需求的网站,开发者通常会在提示词中事无巨细地说明设计细节、交互逻辑乃至技术约束。这种“精细化指令”对模型提出了更高要求:是否真正理解用户意图、能否在复杂任务中稳定执行,成为检验模型实力的关键。

在实测中,我们向Doubao-Seed-Code一次性发送了超长提示词,希望模型打造一个开源项目分享网站的原型。提示词中明确规定了顶部导航栏、主题展示区、筛选工具等具体组件,还对设计风格提出了详细要求。

模型不仅准确还原了提示词中的设计,还生成了可直接交互的前端页面,页面布局清晰、交互逻辑合理,整体风格与要求中的“科技感”高度契合。


除了原型开发,找Bug也是编程模型的另一大用途。然而,在生产环境中真正放手让大模型修改代码,仍然存在引入新错误、逻辑偏差或安全漏洞的风险。

令人惊喜的是,Doubao-Seed-Code不仅拥有原生256K上下文,可在大型代码库中搜索解决Bug,还展现出了不错的复杂代码修复能力和操作规范意识。

我们将一个人为编写,含有Bug的Python文件及相关文件夹交给Doubao-Seed-Code处理。它首先能够精确的定位问题,注意到各种报错和风险。


▲Doubao-Seed-Code在Claude Code中修复代码

修复代码时,Doubao-Seed-Code采取的策略是分步骤、增量式的——它每次修改后都会立即验证,确保改动落地。

更难能可贵的是,Doubao-Seed-Code并不仅仅局限于语法修复,它能理解程序的逻辑和业务需求,主动改进异常处理和输入验证,使程序更加安全、可靠。通过持续的自我检查与迭代,它能够发现之前修复留下的潜在问题,并进行进一步优化。

挑战完前端设计和Bug修复,我们还尝试让Doubao-Seed-Code深入后端数据库——这将进一步挑战模型的能力边界。

数据库表、字段、关系和约束规则相比前端页面元素更加抽象,模型需要理解不同字段之间的依赖和作用。在设计数据库操作时,如何保证数据一致性、避免冲突和冗余,是一项考验模型推理能力的挑战。

此时,Doubao-Seed-Code的规划能力派上了大用场,能看到它打造的系统结构清晰,符合真实生产场景对可扩展性和安全性的要求。


当然,在这种复杂任务下,Doubao-Seed-Code也难以一次完成全部工作。当出现各类Bug时,我们只需将相关代码、报错信息提供给模型,再辅以简单描述,模型就能进行进一步修改,最终迭代出可用的数据库系统。


我们还能以同样的方式,在现有基础上新增复杂功能,例如权限管理等。这些功能叠加后,已经可以满足部分生产环境的实际需求。


三、起底豆包编程模型训练配方:纯强化学习炼出SOTA模型

这样一款在真实生产场景也十分能打的编程模型,究竟是如何炼成的呢?火山引擎表示,为了训练Doubao-Seed-Code,他们打造了一个大规模的Agent强化学习训练系统。

数据是智能的重要来源。Doubao-Seed-Code在训练过程中使用了覆盖10万容器镜像的庞大训练数据集,并提供端到端沙盒环境进行评测,确保模型能应对多样化、复杂的编程场景。

而模型的训练系统具备万级并发沙盒session能力,依托千卡GPU集群实现超大规模并行训练,使模型能够在高负载下稳定学习。

通过强化学习优化,Doubao-Seed-Code直接从任务沙盒反馈中学习,基于这套系统,模型无需蒸馏或标注的冷启动数据,训练路径简洁高效。

下游指标显示,模型在Multi-SWE-Bench 和SWE-Bench-Verified数据集上表现出色,呈现稳定上升趋势,展现出泛化能力。


在SWE-Bench基准测试中,Doubao-Seed-Code仅依靠强化学习训练即可实现SOTA级别的性能,验证了纯强化学习在真实软件工程场景下的潜力。

除了强化学习训练过程中的设计,火山引擎还为Doubao-Seed-Code配备了全量透明缓存能力,上下文缓存可在多轮对话场景中减少重复计算,大幅提升交互效率与响应速度。

配合Doubao-Seed-Code的发布,火山引擎同步发布了Coding Plan。


与海外大模型动辄数百美元的价格相比,方舟Coding Plan展现出较强的性价比。Lite套餐适合大多数开发者,可支持中等强度的开发任务,首购首月价格仅为9.9元,而复杂项目开发则可以选择Pro套餐,首购首月价格为49.9元。


用户可在Claude Code、veCLI、Cursor、Cline、Codex CLI等主流智能编程环境中使用这一Coding Plan。火山引擎的资源池能满足多用户并行、复杂任务场景下的稳定响应和输出,这意味着企业级用户也可以放心地大规模调用Doubao-Seed-Code等模型,并获得较为可靠的使用体验。

结语:国产编程模型,走到关键机遇期

近几个月以来,有不少海外AI编程模型面临断供风险,这对依赖高性能AI工具的开发者和企业来说,是不小的挑战。

像Doubao-Seed-Code这样的国产编程模型的崛起,正迅速填补这一空白,为开发者提供稳定可控的替代方案。随着国产模型在性能和兼容性等方面的不断优化,其在国内开发生态中的影响力和应用潜力也将日益凸显,为企业和开发者带来更加稳健的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1983年,黄永胜弥留之际苦求一事,中央特批:满足他

1983年,黄永胜弥留之际苦求一事,中央特批:满足他

寄史言志
2026-01-14 16:36:19
全线跳水,超11万人爆仓!

全线跳水,超11万人爆仓!

每日经济新闻
2026-02-16 08:30:07
1-8!0-3!日本足球到头了,U16惨败德国、葡萄牙,C罗儿子送助攻

1-8!0-3!日本足球到头了,U16惨败德国、葡萄牙,C罗儿子送助攻

绿茵舞着
2026-02-15 17:21:09
越南人吐槽:我们学的历史课,“中国”占据了80%,还要背诵唐诗

越南人吐槽:我们学的历史课,“中国”占据了80%,还要背诵唐诗

铭记历史呀
2026-01-28 02:21:58
俄官方媒体突然改口了,精英阶层公开要求结束战争!

俄官方媒体突然改口了,精英阶层公开要求结束战争!

知兵
2026-02-14 09:52:31
征服中年女人,无需套路:两颗真心,一生相守

征服中年女人,无需套路:两颗真心,一生相守

青苹果sht
2025-11-04 06:10:40
宁德时代、洛阳钼业等将纳入香港恒生指数 股价均走强

宁德时代、洛阳钼业等将纳入香港恒生指数 股价均走强

证券时报
2026-02-16 10:32:02
凌晨俄最大军火库遭爆炸,12小时殉爆改写战争逻辑

凌晨俄最大军火库遭爆炸,12小时殉爆改写战争逻辑

落梅如雪乱飞
2026-02-14 12:38:15
因违反账户管理、反洗钱等十大规定,建行被罚没超4350万元

因违反账户管理、反洗钱等十大规定,建行被罚没超4350万元

观察者网
2026-02-15 21:49:09
他是央视知名主持人,31岁因一句话离央视赴美国,如今51岁怎样了

他是央视知名主持人,31岁因一句话离央视赴美国,如今51岁怎样了

长歌侃娱
2026-02-16 07:10:03
除夕夜,远嫁八年的女儿突然回家,看见她穿的衣服,我喜不自胜

除夕夜,远嫁八年的女儿突然回家,看见她穿的衣服,我喜不自胜

船长与船1
2026-02-16 10:12:57
男子收到父亲消息说猫丢了,贴了重金悬赏却收到很多美女加微信…

男子收到父亲消息说猫丢了,贴了重金悬赏却收到很多美女加微信…

爱宠物
2026-02-14 22:03:51
隋文静/韩聪短节目第六:“不去想伤痛就是对抗伤痛的最好办法”

隋文静/韩聪短节目第六:“不去想伤痛就是对抗伤痛的最好办法”

中国青年报
2026-02-16 08:18:07
印度百姓怒了,耗资340亿造全球最高雕像,结果却是中国制造

印度百姓怒了,耗资340亿造全球最高雕像,结果却是中国制造

策略述
2025-12-21 23:13:25
苹果同意铠侠涨价100%,且每季重新议价!

苹果同意铠侠涨价100%,且每季重新议价!

芯智讯
2026-02-15 12:00:11
欧洲富婆来中国旅游,回国一周后哭诉:瑞士跟中国差距一目了然

欧洲富婆来中国旅游,回国一周后哭诉:瑞士跟中国差距一目了然

而长终
2026-02-12 18:01:30
日本妹子赤裸上身做引体向上引热议!背影比男人还壮?

日本妹子赤裸上身做引体向上引热议!背影比男人还壮?

姿势跑法
2026-02-09 11:46:08
韩媒:还是0金!中国连遭韩国巴西羞辱 “不毛之地”都夺历史首金

韩媒:还是0金!中国连遭韩国巴西羞辱 “不毛之地”都夺历史首金

念洲
2026-02-15 12:41:16
2026春节档新片预售票房破4亿

2026春节档新片预售票房破4亿

界面新闻
2026-02-16 09:30:06
3:1局面!中国果然还有底牌,日本回过神来:真不该得罪金正恩

3:1局面!中国果然还有底牌,日本回过神来:真不该得罪金正恩

万物知识圈
2026-02-16 09:27:46
2026-02-16 11:19:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11235文章数 116972关注度
往期回顾 全部

科技要闻

OpenAI拿下OpenClaw之父 承诺开源绝不动摇

头条要闻

男子在知名平台买二手苹果手表 看到了前机主许多照片

头条要闻

男子在知名平台买二手苹果手表 看到了前机主许多照片

体育要闻

遭针对?谷爱凌炮轰国际雪联安排

娱乐要闻

2026央视春晚最新剧透 重量级嘉宾登场

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

游戏
本地
亲子
数码
公开课

黑人主角被批“觉醒”!《寂静岭》新作引热议

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

亲子要闻

“压岁钱”应该什么时候给?

数码要闻

苹果确认新版Siri今年推出,仍按计划推进中

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版