网易首页 > 网易号 > 正文 申请入驻

不怕Claude断供!豆包编程模型来了,5分钟造“我的世界”翻版,花费2毛钱

0
分享至


智东西
作者 陈骏达
编辑 漠影

首款豆包编程模型,来了!

智东西11月11日报道,今天,字节跳动旗下云和AI服务平台火山引擎,发布了豆包大模型家族中的首款编程模型——Doubao-Seed-Code。这是一款专门面向Agentic Coding任务优化的编程模型,并在性价比上实现了突破。

性能方面,在业内多个主流编程测评集中,Doubao-Seed-Code的得分超过了DeepSeek-V3.1、Kimi-K2、GLM-4.6等国产模型,整体表现仅次于当前AI编程领域的顶级模型——Claude Sonnet 4.5。此外,Doubao-Seed-Code拥有原生256K上下文,比Claude Sonnet 4.5的200K上下文还要高。


榜单之外,Doubao-Seed-Code还注重在真实编程场景的落地。得益于其专门面向主流开发工具的优化,无论是Claude Code、Trae还是veCLI的用户,都能轻松上手,并获得稳定的输出效果。

同时,Doubao-Seed-Code是国内首个支持视觉理解能力的编程模型,它可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和Bug修复,大幅提升前端开发效率。

值得一提的是,今天,字节跳动旗下的AI原生IDE产品Trae中国版已经接入了Doubao-Seed-Code模型,Trae+Doubao-Seed-Code的组合,在权威编程基准测试SWE-Bench-Verified中一同登顶SOTA,实现模型+工具的生态闭环。


结合价格后,Doubao-Seed-Code变得更能打了。这一模型采用了分层定价模式,在用户使用最多的0-32K输入区间上,Doubao-Seed-Code的输入价格为1.20元/百万Tokens,输出价格8.00元/百万Tokens。使用全量透明缓存后,模型的使用成本还能再降低80%,综合使用成本降低62.7%


我们在实测时让Doubao-Seed-Code复刻了经典游戏《我的世界》,成本不到2毛钱,画风、游戏体验上都与原版相似,直接可玩。相同tokens量下(0-32k区间),Claude Sonnet 4.5完成任务的成本已经超过3元。


近日,智东西抢先深度体验了Doubao-Seed-Code在真实编程场景里的效用,它不仅能自主规划开发计划、快速搭建前端网页,还能深入数据库进行修改,遇到错误时主动修复、补充注释、优化结构。到这一刻,Doubao-Seed-Code不再只是“写代码的机器”,而是一个能与人并肩思考、共同创造的开发伙伴。

一、无缝接入Claude Code,一张截图就能复刻“抖音”

工具兼容性一直是影响AI编程模型采用的主要因素之一,这次,Doubao-Seed-Code在工具的适配上下足了功夫。Doubao-Seed-Code选择了原生兼容Anthropic API,无需经过任何转换即可直接Claude Code。这意味着广大熟悉Claude Code的开发者,几乎可以不费任何学习成本地将API轻松切换到Doubao-Seed-Code。


火山方舟平台还为Doubao-Seed-Code提供了详细的API调用指南,纯小白用户只需跟着指南一步一步走,就能体验到新模型。

在深度实测Doubao-Seed-Code的开发能力之前,我们先来几道“开胃菜”。

小球弹跳几乎已经成了大模型的必考题。Doubao-Seed-Code打造的小球弹跳不仅符合物理规律,还十分丝滑。同时,模型自主决定新增了一个功能,只要点击小球就可以改变其受力情况,让小球弹跳不再只是无限循环。


我们还测试了模型按照网页截图开发的能力。在上传截图后,Doubao-Seed-Code可以分析页面布局、视觉特点等,然后逐步搭建网页的核心组件。将结果发送给用户前,模型还会进行功能测试,然后再交付成品。


在日常应用场景中,使用Doubao-Seed-Code 开发小工具同样快捷高效。我们尝试输入“生成一个宠物日记 App”,模型便自动搭建App框架、设计组件。


仅需几分钟,模型便交付了可直接使用的成品。从登录界面到图像、文字的上传,都能正常运转。


在开发过程中,我们观察到 Doubao-Seed-Code 遵循“先规划,再开发”的逻辑,并利用深度思考能力对生成结果进行自我分析与优化。当用户需求不够明朗时,模型还能主动梳理需求,甚至提出问题以获取更多信息。

这些特性,成为Doubao-Seed-Code在真实生产环境中部署的重要基础。

二、前后端代码都能写,超大上下文可改生产级代码库

实际上,Doubao-Seed-Code的能力远不止于打造有趣的小程序或网页,它完全可以胜任复杂的一线开发任务。

为了打造更贴合真实使用需求的网站,开发者通常会在提示词中事无巨细地说明设计细节、交互逻辑乃至技术约束。这种“精细化指令”对模型提出了更高要求:是否真正理解用户意图、能否在复杂任务中稳定执行,成为检验模型实力的关键。

在实测中,我们向Doubao-Seed-Code一次性发送了超长提示词,希望模型打造一个开源项目分享网站的原型。提示词中明确规定了顶部导航栏、主题展示区、筛选工具等具体组件,还对设计风格提出了详细要求。

模型不仅准确还原了提示词中的设计,还生成了可直接交互的前端页面,页面布局清晰、交互逻辑合理,整体风格与要求中的“科技感”高度契合。


除了原型开发,找Bug也是编程模型的另一大用途。然而,在生产环境中真正放手让大模型修改代码,仍然存在引入新错误、逻辑偏差或安全漏洞的风险。

令人惊喜的是,Doubao-Seed-Code不仅拥有原生256K上下文,可在大型代码库中搜索解决Bug,还展现出了不错的复杂代码修复能力和操作规范意识。

我们将一个人为编写,含有Bug的Python文件及相关文件夹交给Doubao-Seed-Code处理。它首先能够精确的定位问题,注意到各种报错和风险。


▲Doubao-Seed-Code在Claude Code中修复代码

修复代码时,Doubao-Seed-Code采取的策略是分步骤、增量式的——它每次修改后都会立即验证,确保改动落地。

更难能可贵的是,Doubao-Seed-Code并不仅仅局限于语法修复,它能理解程序的逻辑和业务需求,主动改进异常处理和输入验证,使程序更加安全、可靠。通过持续的自我检查与迭代,它能够发现之前修复留下的潜在问题,并进行进一步优化。

挑战完前端设计和Bug修复,我们还尝试让Doubao-Seed-Code深入后端数据库——这将进一步挑战模型的能力边界。

数据库表、字段、关系和约束规则相比前端页面元素更加抽象,模型需要理解不同字段之间的依赖和作用。在设计数据库操作时,如何保证数据一致性、避免冲突和冗余,是一项考验模型推理能力的挑战。

此时,Doubao-Seed-Code的规划能力派上了大用场,能看到它打造的系统结构清晰,符合真实生产场景对可扩展性和安全性的要求。


当然,在这种复杂任务下,Doubao-Seed-Code也难以一次完成全部工作。当出现各类Bug时,我们只需将相关代码、报错信息提供给模型,再辅以简单描述,模型就能进行进一步修改,最终迭代出可用的数据库系统。


我们还能以同样的方式,在现有基础上新增复杂功能,例如权限管理等。这些功能叠加后,已经可以满足部分生产环境的实际需求。


三、起底豆包编程模型训练配方:纯强化学习炼出SOTA模型

这样一款在真实生产场景也十分能打的编程模型,究竟是如何炼成的呢?火山引擎表示,为了训练Doubao-Seed-Code,他们打造了一个大规模的Agent强化学习训练系统。

数据是智能的重要来源。Doubao-Seed-Code在训练过程中使用了覆盖10万容器镜像的庞大训练数据集,并提供端到端沙盒环境进行评测,确保模型能应对多样化、复杂的编程场景。

而模型的训练系统具备万级并发沙盒session能力,依托千卡GPU集群实现超大规模并行训练,使模型能够在高负载下稳定学习。

通过强化学习优化,Doubao-Seed-Code直接从任务沙盒反馈中学习,基于这套系统,模型无需蒸馏或标注的冷启动数据,训练路径简洁高效。

下游指标显示,模型在Multi-SWE-Bench 和SWE-Bench-Verified数据集上表现出色,呈现稳定上升趋势,展现出泛化能力。


在SWE-Bench基准测试中,Doubao-Seed-Code仅依靠强化学习训练即可实现SOTA级别的性能,验证了纯强化学习在真实软件工程场景下的潜力。

除了强化学习训练过程中的设计,火山引擎还为Doubao-Seed-Code配备了全量透明缓存能力,上下文缓存可在多轮对话场景中减少重复计算,大幅提升交互效率与响应速度。

配合Doubao-Seed-Code的发布,火山引擎同步发布了Coding Plan。


与海外大模型动辄数百美元的价格相比,方舟Coding Plan展现出较强的性价比。Lite套餐适合大多数开发者,可支持中等强度的开发任务,首购首月价格仅为9.9元,而复杂项目开发则可以选择Pro套餐,首购首月价格为49.9元。


用户可在Claude Code、veCLI、Cursor、Cline、Codex CLI等主流智能编程环境中使用这一Coding Plan。火山引擎的资源池能满足多用户并行、复杂任务场景下的稳定响应和输出,这意味着企业级用户也可以放心地大规模调用Doubao-Seed-Code等模型,并获得较为可靠的使用体验。

结语:国产编程模型,走到关键机遇期

近几个月以来,有不少海外AI编程模型面临断供风险,这对依赖高性能AI工具的开发者和企业来说,是不小的挑战。

像Doubao-Seed-Code这样的国产编程模型的崛起,正迅速填补这一空白,为开发者提供稳定可控的替代方案。随着国产模型在性能和兼容性等方面的不断优化,其在国内开发生态中的影响力和应用潜力也将日益凸显,为企业和开发者带来更加稳健的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
祖坟管几代人?谁的坟对你影响最大?看看百岁老道长怎么说的

祖坟管几代人?谁的坟对你影响最大?看看百岁老道长怎么说的

千秋文化
2026-03-30 20:30:53
王楚钦夺冠后发文:最好看的颜色永远是中国红

王楚钦夺冠后发文:最好看的颜色永远是中国红

喜欢历史的阿繁
2026-04-06 19:49:50
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
日本乒乓球名将水谷隼说:中国队之所以强大,根本不是技术优势

日本乒乓球名将水谷隼说:中国队之所以强大,根本不是技术优势

篮球看比赛
2026-02-04 17:46:56
46号令实施!国企退休待遇核查启动,三类人员将被重点追溯

46号令实施!国企退休待遇核查启动,三类人员将被重点追溯

君说舆情
2026-04-05 11:19:39
1.5万美金的真相:1盒雪茄、1张机票,1艘走私船,没有封闭的霍尔木兹海峡

1.5万美金的真相:1盒雪茄、1张机票,1艘走私船,没有封闭的霍尔木兹海峡

新浪财经
2026-04-06 19:08:50
大量游客被困山顶:有人裹垃圾袋、呕吐、失温,景区回应

大量游客被困山顶:有人裹垃圾袋、呕吐、失温,景区回应

最江阴
2026-04-06 13:03:05
No!膝盖受伤倒下!这可是广东队的得分王

No!膝盖受伤倒下!这可是广东队的得分王

篮球实战宝典
2026-04-06 16:22:51
吓一跳!以色列到底有多“变态”?

吓一跳!以色列到底有多“变态”?

深度报
2026-04-02 21:17:42
日政客叫嚣无需对华道歉,马克龙访日后态度突变,G7峰会拒邀中国

日政客叫嚣无需对华道歉,马克龙访日后态度突变,G7峰会拒邀中国

娱乐小可爱蛙
2026-04-06 18:58:24
盾构机运到孟买,印度给中国交尾款,首付即全款套路行不通了

盾构机运到孟买,印度给中国交尾款,首付即全款套路行不通了

王新喜
2026-04-06 11:37:03
为啥情侣容易怀孕,夫妻反导不孕不育,生殖科医生:真相有点扎心

为啥情侣容易怀孕,夫妻反导不孕不育,生殖科医生:真相有点扎心

菁妈育儿
2026-04-06 13:25:44
杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

千秋文化
2026-04-01 20:35:51
祝贺!35岁数学家王虹,获得最高荣誉

祝贺!35岁数学家王虹,获得最高荣誉

双一流高校
2026-04-06 00:09:39
从“日涨百万”到泡沫散尽,曾经一夜爆红的郭有才,如今怎样了?

从“日涨百万”到泡沫散尽,曾经一夜爆红的郭有才,如今怎样了?

星星没有你亮
2026-04-05 17:09:30
人老了,最舒服的日子,就这10个字

人老了,最舒服的日子,就这10个字

青苹果sht
2026-04-02 05:56:34
申裕斌成韩乒队史首人!入四强登韩媒热搜:11-0打崩中国28岁王牌

申裕斌成韩乒队史首人!入四强登韩媒热搜:11-0打崩中国28岁王牌

林子说事
2026-04-05 21:49:28
湖人锁定西部前五,首轮对手基本确定,大概率要一轮游了

湖人锁定西部前五,首轮对手基本确定,大概率要一轮游了

刘哥谈体育
2026-04-06 17:09:32
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
随着日本2-0,朝鲜6-0,U20女足亚洲杯最新积分榜:中国0丢球领跑

随着日本2-0,朝鲜6-0,U20女足亚洲杯最新积分榜:中国0丢球领跑

俯身冲顶
2026-04-06 06:18:37
2026-04-06 20:28:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11516文章数 117024关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

媒体:付出不菲代价 "拯救大兵"行动仍有疑点未解开

头条要闻

媒体:付出不菲代价 "拯救大兵"行动仍有疑点未解开

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

手机
艺术
亲子
公开课
军事航空

手机要闻

OPPO Find X9s Pro再次被确认:小直屏+哈苏增距镜,续航也有惊喜

艺术要闻

殊相——中国油画学会创作研修作品展 | 油画选刊(五)

亲子要闻

怀孕后有以下几种反应,妈妈们要重视,孕期也要降“甜度”

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:在C-130运输机残骸中发现一具美军士兵遗体

无障碍浏览 进入关怀版