网易首页 > 网易号 > 正文 申请入驻

模型发布更快,企业怎么跟上?看德勤 47 万人的落地方法|Anthropic CPO

0
分享至

全文 3,000字 | 阅读约 8 分钟

(Mike Krieger 播客片段:为什么 Claude 发布越来越快?)

上周 ,Anthropic 发布 Claude Sonnet 4.5。 距离 Claude 4 上线,仅四个月。

这次发布的结果出人意料: 性能全面超越旗舰模型 Opus,成本却只有五分之一。

但 Anthropic 没有召开大规模技术发布会。

2025 年 10 月 9日,CPO Mike Krieger 说了一段话:

这次不是模型迭代得更快了,是我们的发布方式变了。我们不再一版版做模型,而是在搭建 Agent 工厂。

这不是营销话术。

四个月内,Anthropic 完成了一次完整的产品重构:

  • 从 Claude Code 到 Claude Agent SDK,

  • 从后训练流程到企业部署方式,

  • 从模型能力到平台化调度,

所以问题不是为什么发布更快, 而是:企业怎么用得上?

德勤 47 万人的部署,给出了最新答案。

第一节|模型提速,为什么越来越快?

“我们不是靠灵光一现,而是把流程做顺了。” 这是 Mike Krieger 谈到 Claude 4.5 发布节奏时,最核心的一句话。

你看今年的大模型节奏就知道,几乎所有 AI 公司都在加速:

  • OpenAI 每季度一个发布会,

  • Google Gemini 接连几轮更新,

  • 国内多个基础模型团队,也开始“月更”……

但 Anthropic 做到了别人没做到的:发布比上代旗舰更强、成本更低的版本。

怎么做到的?的答案里没有算法领先,只有三个字:做流程。

1. 先听客户要什么,再决定模型做什么

Mike 说,Sonnet 4.5 是第一版客户驱动的模型。

“我们大量和终端客户对话,他们告诉我们 Sonnet 4 哪里好用、哪里不够。这些反馈直接变成研究目标。”

比如,Sonnet 4 和 Opus 4 写代码不错,但任务时间一长,模型容易遗忘上下文、思路跑偏。这是最常见的客户反馈。

4.5 就重点解决这个,让模型能在更长时间内保持连贯。

过去是研究员试新方法,现在是客户列需求。研发目标从模糊变成可追踪的任务列表。

2. 发布不再临时赶工,按产品节奏跑

“你知道,我们第一次能在模型发布当天,和客户同步上线。”

Mike 说,这是他最满意的地方之一。

在他加入初期(Sonnet 3.5 时代),模型发布像打一场硬仗:每次从头摸流程,写文档、测接口、排错误。

而到了 Sonnet 4.5:发布前几天就打通全部流程,连邮件模板都提前准备好。模型上线就像发布 App。

他甚至分享了一个客户的评价:

“这是我见过最顺畅的模型发布。”

不再靠熬夜赶工,而是有标准、有工具、有节奏。

3. 上线不是交付,是一起用

团队开始“吃自己的狗粮”。

Mike 他们最好的工程师现在同时管理三四个 Claude Code 实例:你要更高层次地思考,把任务分解,让每个 Claude Code 处理不同的部分。工程师从写代码变成了管理 AI。

以前,出事了是人先到现场。现在,是 Claude 先到。

这不是演示,是每天真实的工作方式。模型在真实场景中反复迭代。

所以,Sonnet 4.5 发布节奏提速,并不是因为 Claude 更聪明、研究团队更强,而是三件事变了:

  • 客户成了产品定义者,

  • 上线流程像做 App 一样标准、流畅,

  • 团队自己就是用户,模型在真实环境中反复试错。

节奏改变的本质,不是拼速度,而是做流程。

第二节|快还要稳,怎么做到的?

Claude Sonnet 4.5 提速,不只因为发布流程更顺。

更关键的是,它从"工具"变成了能主动协作的 Agent。

Mike 在对话中说:

“我们不只用 Claude 补全代码,它本身就能参与协作。它已经像同事一样,在 Slack 群里值班了。”

✅ 不是模型在答题,而是直接处理问题

Mike 说,他们内部做了一个叫 “Claude On Call” 的 Agent:

“它会在事故发生的第一分钟出现在群里,自动查看指标,快速判断原因,有时还会提醒:要不要检查一下那个服务是不是又挂了。”

这就是 Agent 跟传统 AI 的区别:不是你问它答,而是它自己判断何时该说话、说什么有用。

Mike 给出了内部评分标准,一个真正的 Claude Agent 至少要做到:

  • 自主判断:不等指令,能判断何时出场

  • 使用工具:调用数据库、搜索资料、写入日志

  • 持续学习:不是每次重来,随使用次数变熟练

  • 主动协作:能进群、参与流程,不是独立窗口

  • 长时运行:任务时间可以是 5 分钟,也可以是 5 小时

人类员工做 100 次任务,应该比第一次做得更好。Claude 也应该这样。

✅ Claude Code:用 Claude 开发 Claude

在整个 Sonnet 4.5 版本里,Claude Code 是最早用上 Agent 能力的场景。

Mike 说,他们现在用 Claude Code 开发 Claude Code 本身。

“它写的不只是几段代码,而是能改动整个项目结构。我们用每个版本的 Claude 去重构 claude.ai 网站,从版本 1 到 4.5,只有 4.5 成功完成了。”

这不仅说明模型能力更强,还说明:

  • Claude 能看得懂上下文

  • Claude 能规划多步执行

  • Claude 能根据实际效果调整做法

而这些能力,已经不再是“问答模型”的范畴,而是 Agent 的核心特征。

✅ SDK 推出:发布的是能接任务的 AI

为了让更多人用上 Claude Agent,Anthropic 推出了 Claude Agent SDK。

简单说,这是一个开发工具包,企业或个人开发者都能用它来:

  • 把 Claude 接入自己的内部系统

  • 让它拥有某种角色,比如财务顾问、客服助手、个人助理

  • 让它能够长时间执行任务,比如跑一个30小时的自动化报表流程

Mike 明确说:

“我们以前叫它 Claude Code SDK,大家以为只能写代码。后来改名叫 Claude Agent SDK,因为它能做的远超写代码。”

第一节讲的是:Claude 发布流程更顺畅。这一节要说的是:Claude 本身也变了。

第三节|Claude SDK,到底能做什么?

Sonnet 4.5 发布后,有个数据引起关注:性能超越 Opus 4.1,成本只有五分之一。

什么概念?

Opus 4.1 曾是 Anthropic 的旗舰模型。现在,一款更轻量的模型在多数任务上都超过了它,运行成本不到 20%。

这像某种算法突破。但 Mike Krieger 的解释很朴实:不是魔法。我们只是把工程做扎实了。

三个关键点,让成本降低 80%:

① 后训练:训练完不上线,持续打磨体验”

Mike 反复提到一个词:“后训练”(post-training)。这是什么意思?

就像做产品不是写完就发布,而是根据用户反馈打磨。模型训练完后也一样,继续根据真实场景调优:

  • 更精准的指令遵循(模型更清楚如何响应)

  • 更好的风格一致性(输出更专业)

  • 更强的执行稳定性(长时间任务不中断)

Mike 说得很直接:

“如果只能做到 50%,那只是演示。要做到 80% 甚至 90%,才能真正帮你完成工作。”

② 工程优化:不是用更多 GPU,是提高资源效率

Claude 能力变强,并不是因为用了更多的 GPU,而是因为 调度、存储、执行都优化了。

Mike 说:

“过去 6 个月,真正进展最大的不是模型结构,是工程优化。”

具体来说:

  • 加速器间并行调度更稳定,

  • 模型中断概率降低,

  • 发布流程标准化。

就像厨房做菜:同样的设备,以前一道菜 30 分钟,现在流程调顺、食材备好、火候可控,10 分钟出菜,还能同时做三道。

不是换了更好的锅,是把整个流程优化了。

③ 小模型追平大模型:靠工艺细节

过去的认知:大模型强但慢,小模型快但弱。

Claude Sonnet 4.5 打破了这个认知。

Mike 明确表示:Sonnet 4.5 的核心不是更大,是更精。它在很多任务上已经超过 Opus,而且更快、更便宜,能承接更多场景。

比如,在 Claude Code 场景中,Sonnet 4.5 是第一个能独立构建完整网站版本的模型。

Mike 说,他们做了一个实验:让每一代 Claude 去重建 claude.ai 网站。

“只有 Sonnet 4.5 做出了真正能用的版本。包括登录、API 调用、前后台页面、权限控制,全部搞定。”

这说明它既懂原理,又能落地。

第四节|德勤怎么用上更快的 Claude?

Claude Sonnet 4.5 很强。

但 Mike Krieger说:

“强不强不是关键,用得上才是。”

这句话背后,是 Anthropic 团队对 AI 工具落地过程的反复观察。

他们发现,大多数企业在面对新模型时,常常卡在两件事上:

  • 没时间试用,内部流程跟不上;

  • 用是能用,但真正融入业务流程很难。

所以 Anthropic 做了一套"落地工具包",提供能直接上手的模板,不用自己拼技术。

✅ Claude SDK:接入新模型像打开 App

你可以把 Claude SDK 理解成:

一套帮助企业把 Claude 接入业务流程的“接线板”。

Mike 举了几个最常见的用法:


1、客服自动回复:

不用训练自己的模型,直接调用 Claude 做 FAQ 回答

还能根据用户历史提问自动调整语气和风格


2、文档助手:

把企业内部文档、知识库接进 Claude

客户问问题时,Claude 会先“看资料”,再回答,确保说得靠谱


3、内部 AI 助理:

给员工用的,不是对客户的

比如:帮产品经理整理需求文档、帮运营写月报、帮销售生成邮件模板

Mike 强调:我们不是要让企业做出一个大模型平台,而是帮他们做出一个有用的 Claude。

提供的是能直接嵌入业务的 AI 模块。

✅ 内置安全规范:让企业敢用

让企业敢用 AI,不仅要好用,还得放心。

所有部署出来的 Claude Agent,都必须有三重安全机制。

分别是:

  • 身份确认机制: 不让 Agent 冒充人类回答敏感内容

  • 拒答机制: 对于模糊或风险话题,明确说“不知道”或拒绝作答

  • 可追溯机制: 每一次调用、每一个回答,都可以回溯源文档和判断链条

这些机制,都被写在 SDK 默认模板里,企业不需要自己再设计。Anthropic 不希望企业独自承担风险,而是要让 Claude 成为默认可托付的伙伴。

✅ 最大规模落地:德勤 47 万员工部署

(Anthropic 与德勤达成史上最大规模企业部署(来源:CNBC))

Claude 的嵌入式打法已在真实企业落地。

最大规模合作对象之一是德勤。

德勤刚刚宣布:将在全球 150 多个国家、面向 47 万名员工部署 Claude。这是 Anthropic 迄今为止最大规模的企业合作项目。

不同部门用 Claude 的方式也不同。会计师、审计师、软件工程师,都将拥有属于自己的“Claude 角色”,由德勤的 AI 团队定制开发。员工还可以向德勤专门设立的“Claude 卓越中心”求助,像找内部专家一样快速使用 AI。

Anthropic 首席商务官 Paul Smith 说:我们双方都投入了大量资源,包括财力和工程力量。

德勤 CTO Ranjit Bawa 的一席话,道出了背后的核心逻辑:

客户总会问我们:你们自己用了吗?只有我们先用起来,才能更有说服力。

这不是口号,而是示范:AI 不只卖方案,更要让组织自己先转变。

这印证了 Mike Krieger 观点的:模型发布只是开始,真正有价值的是企业内部能跑起来。

结语|企业怎么跟上?答案是"先启动"

Anthropic 的节奏越来越快。Sonnet 4.5 发布仅数月,下一个版本已在路上。

但 Mike Krieger 给出的答案不是追赶模型能力,而是改变使用方式。

企业如何跟上?三个关键:

  • 流程要顺:不是临时赶工,而是让 AI 接入变成标准动作

  • 先用起来:不等完美方案,先启动一个 Agent 让组织适应

  • 默认安全:用 SDK 内置规范,而不是自己从零设计

当模型更新越来越频繁,关键不是有没有 API 权限,而是:

工作流程能否容纳快速变化的 AI?

员工能否在不重构流程的前提下用起来?

有没有一套默认可托付的使用规范?

Claude SDK 的范式是:不需要完美接入,但必须先启动。

启动一个 FAQ Agent、文档助手或邮件生成器,就意味着组织具备了响应变化的能力。

本文由 AI深度研究院出品,内容整理自 Mike Krieger(Anthropic CPO)在 Big Technology Podcast 和 Latent Space Podcast 的最新访谈。未经授权,不得转载。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:

https://www.youtube.com/watch?v=GmcTq0Zo8kM&t=933s

https://www.youtube.com/watch?v=aJxnel2_O7Q&t=865s

https://www.cnbc.com/2025/10/06/anthropic-deloitte-enterprise-ai.html#:~:text=Deloitte%20on%20Monday%20announced%20a,companies%20first%20unveiled%20last%20year.

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刷新历史第一!詹姆斯29+13+6献扳平三分 加时夺赛点触发晋级定律

刷新历史第一!詹姆斯29+13+6献扳平三分 加时夺赛点触发晋级定律

醉卧浮生
2026-04-25 11:02:29
四个“西字辈”省份排名大洗牌

四个“西字辈”省份排名大洗牌

城市财经
2026-04-25 11:35:03
杨钰莹首谈毛宁:当年被赖文峰6辆奔驰追走,错过他后悔了28年

杨钰莹首谈毛宁:当年被赖文峰6辆奔驰追走,错过他后悔了28年

子芫伴你成长
2026-04-24 22:49:47
赖清德飞机被拒,美国急得跳脚:你连领空都不给过,我这“站台”站了个寂寞?

赖清德飞机被拒,美国急得跳脚:你连领空都不给过,我这“站台”站了个寂寞?

两岸观点
2026-04-23 12:30:15
乌度卡谈最后崩盘:我不知道他们是太年轻,还是惧怕关键时刻

乌度卡谈最后崩盘:我不知道他们是太年轻,还是惧怕关键时刻

懂球帝
2026-04-25 12:18:07
震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

火山詩话
2026-04-24 10:39:54
“畸胎瘤残留在咽喉”,有软骨有脂肪!6岁男孩饮食习惯不对劲,上海医生一查惊了……

“畸胎瘤残留在咽喉”,有软骨有脂肪!6岁男孩饮食习惯不对劲,上海医生一查惊了……

环球网资讯
2026-04-24 18:36:17
“我举报自己”,官方最新回应

“我举报自己”,官方最新回应

中国新闻周刊
2026-04-25 12:23:25
火箭40秒领先6分神奇失利!谢泼德21中6遭喷上热搜:不如麦克朗

火箭40秒领先6分神奇失利!谢泼德21中6遭喷上热搜:不如麦克朗

颜小白的篮球梦
2026-04-25 11:24:51
火箭0-3触发百分百出局定律:本季加时赛9战8败 三少83分仍输球

火箭0-3触发百分百出局定律:本季加时赛9战8败 三少83分仍输球

醉卧浮生
2026-04-25 11:04:57
霍尔木兹海峡封锁,美国能源出口飙升,二战以来首次接近成为原油净出口国

霍尔木兹海峡封锁,美国能源出口飙升,二战以来首次接近成为原油净出口国

红星新闻
2026-04-25 12:32:20
张军被带走传闻多日,多种迹象表明情况严重,任职高校撤掉其信息

张军被带走传闻多日,多种迹象表明情况严重,任职高校撤掉其信息

米修体育
2026-04-25 09:38:35
彻底摊牌!首相访华结束才5天,该国高官:中国投资可以,人别来

彻底摊牌!首相访华结束才5天,该国高官:中国投资可以,人别来

闻识
2026-04-24 12:23:01
5.8亿!上海最大烂尾商场卖了!要变亚洲最大奥莱?

5.8亿!上海最大烂尾商场卖了!要变亚洲最大奥莱?

阿离家居
2026-04-25 10:55:38
被卖缅甸女学生后续:对方同意放人后表示压力大,又提出无理要求

被卖缅甸女学生后续:对方同意放人后表示压力大,又提出无理要求

青梅侃史啊
2026-04-25 09:29:26
中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

新华社
2026-04-24 17:05:33
G3火箭40秒领先6分都能输?泰特谢泼德成卧底,进攻还不压时间!

G3火箭40秒领先6分都能输?泰特谢泼德成卧底,进攻还不压时间!

篮球资讯达人
2026-04-25 11:19:42
“夜店神器”夜光渔网袜在网上火了 太性感了

“夜店神器”夜光渔网袜在网上火了 太性感了

3DM游戏
2026-04-24 06:40:07
女大学生泰国旅游被高价转卖缅甸园区,照片流出长这么好看被折磨太惨

女大学生泰国旅游被高价转卖缅甸园区,照片流出长这么好看被折磨太惨

不二表姐
2026-04-24 22:41:14
张军失联背后四大影响曝光!李永波巧妙脱身,刘国梁成舆论焦点

张军失联背后四大影响曝光!李永波巧妙脱身,刘国梁成舆论焦点

小椰的奶奶
2026-04-25 11:12:21
2026-04-25 15:07:00
AI深度研究员 incentive-icons
AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
445文章数 171关注度
往期回顾 全部

财经要闻

90%订单消失,中东旺季没了

头条要闻

"蚊子大军"来袭北极圈也被攻破 各地疾控发出重要预警

头条要闻

"蚊子大军"来袭北极圈也被攻破 各地疾控发出重要预警

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

艺术
游戏
手机
健康
公开课

艺术要闻

荒废十多年!福建石狮“最美烂尾楼”,德国品牌接盘了

PS5实体版仅需180元!这款索尼3A级大作真心不能错过

手机要闻

打破沉闷色调:谷歌有望推出松绿色Pixel 11 Pro Fold折叠手机

干细胞如何让烧烫伤皮肤"再生"?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版