网易首页 > 网易号 > 正文 申请入驻

Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5

0
分享至


就在刚刚,Anthropic 发布了 Claude Haiku 4.5。

先简单科普一下,Claude 家族有三个不同参数量级的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。

这次更新最大的看点是,小杯 Claude Haiku 4.5 在模型性能保持高水准的同时,速度更快、价格更便宜了

五个月前,Claude Sonnet 4 还是最先进的模型之一。现在新出的 Haiku 4.5 在编码性能上几乎和它打平手,但价格只要三分之一,速度还翻了两倍多。


▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具体来说,在用于衡量 AI 编码能力的测试集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成绩,什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平线上。

在某些任务比如操控电脑方面,Haiku 4.5 甚至反杀了老大哥 Sonnet 4。

对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或结对编程助手,Haiku 4.5 兼具高智能和出色速度,能带来更好的体验。

使用 Claude Code 的开发者也会发现,Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更灵敏高效。


当然,两周前发的 Sonnet 4.5 依然是 Anthropic 的旗舰模型,归属全球编程模型第一档次。但 Haiku 4.5 提供了另一个选项:性能接近顶配,价格却亲民得多。

而且模型玩法更野了,Sonnet 4.5 可以把复杂问题拆成 N 个小任务,然后指挥一堆 Haiku 4.5 并行开工,这配合相当默契。

Anthropic 对 Haiku 4.5 进行了详细的安全性和对齐性测试。

结果显示,该模型的不良行为发生率较低,且比前代 Haiku 3.5 的对齐性显著提高。在自动化对齐评估中,Haiku 4.5 的总体偏离行为比 Sonnet 4.5 和 Opus 4.1 都更少。

也就是说,它目前是 Anthropic 家最安全的模型。


▲Comparison table of frontier models across popular benchmarks

至于价格嘛...Haiku 4.5 的定价为:每百万输入 token 1 美元,每百万输出 token 5 美元。

对比来看,GPT-5 mini 约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 价格差不多。也就是说,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。

不过跟 Sonnet 4.5 比,它便宜了约三倍,性能却几乎没差,这对开发者来说算是降本增效了。

但有一说一,数学不是它的强项。

知名博主 Dan Shipper 试用后发现,Haiku 在算术上有点... 迷糊。

比如在测试 Uber 账单的例子里,Haiku 虽然完美找出了所有相关邮件,但算总额时直接翻车。更尴尬的是,指出错误后它承认了——然后转头又犯了同样的错

Dan Shipper 给出的中肯评价是:

如果你是开发者或创业者,正在用 Sonnet 4.5 构建复杂的智能代理应用,现在可以考虑切换到 Haiku。你能节省大量成本,而性能损失几乎可以忽略。 如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建议试试 Haiku。虽然价格更高一些,但在需要调用工具和保持自主性的场景中,它的表现更好。


▲附上博客地址:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 现已在 Claude Code 和各类应用中上线了。

开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且价格是 Anthropic 最香的那档。


我们参考@zb1992 的提示词,让 Claude 4.5 Haiku 跑了一个钟表 Demo,整体体验下来,代码生成速度确实更快了,最终成品也令人满意。

在下文这个经典的推理计算题, Claude 4.5 Haiku 响应速度优势就更明显了,当然,这也正是轻量级模型在实际应用中的核心竞争力所在。


另外,据 The Information 报道,估值高达 1700 亿美元的 Anthropic 近几周已告诉投行顾问,计划通过收购引入更多技术人才,同时拓展除编程助手之外的能力——毕竟目前编程这块还是营收大头。


知情人士表示,鉴于 Anthropic 在向开发者提供编程类 AI 产品方面取得的成功,公司下一步可能会扩展至其他开发者常用的软件工具,比如自动测试代码漏洞的工具,或辅助软件设计的工具。

另有消息称,Anthropic 也可能通过收购开发面向特定行业的产品,例如金融服务、医疗保健或网络安全,不过他们更倾向于交易金额在 5 亿美元以下的小型收购项目。

目前看起来,在提升模型能力的同时,Anthropic 也在积极布局生态。AI 圈的你追我赶,最终受益的还是开发者和用户——更强的模型、更低的价格、更多的选择。

作者:莫崇宇

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方高规格接待,卡尼赴京吃晚宴,现场安排特殊,交易迎来窗口期

中方高规格接待,卡尼赴京吃晚宴,现场安排特殊,交易迎来窗口期

健身狂人
2026-01-16 09:28:51
贺娇龙告别仪式:新疆下雪,无数人带鲜花送别,交代的事已完成!

贺娇龙告别仪式:新疆下雪,无数人带鲜花送别,交代的事已完成!

古希腊掌管松饼的神
2026-01-16 10:11:28
叶剑英询问许世友:南京军区还听你调遣吗?许世友直言:军区司令就是我的贴身保镖

叶剑英询问许世友:南京军区还听你调遣吗?许世友直言:军区司令就是我的贴身保镖

清风鉴史
2025-12-24 15:02:13
刘銮雄与吕丽君之女刘秀盈拉小提琴,她23岁好独立,比甘比女儿强

刘銮雄与吕丽君之女刘秀盈拉小提琴,她23岁好独立,比甘比女儿强

小娱乐悠悠
2026-01-16 09:14:54
华国锋退下来了,组织专门找到他的秘书,诚恳让其自己挑前途~

华国锋退下来了,组织专门找到他的秘书,诚恳让其自己挑前途~

鹤羽说个事
2026-01-14 15:22:18
难怪灿灿不干了!丰城杀猪饭遭疯抢,锅盖都按不住,主办人急哭了

难怪灿灿不干了!丰城杀猪饭遭疯抢,锅盖都按不住,主办人急哭了

子芫伴你成长
2026-01-15 22:49:00
2人太致命!火箭48-55雷霆,杜兰特13中3单打过多!

2人太致命!火箭48-55雷霆,杜兰特13中3单打过多!

运筹帷幄的篮球
2026-01-16 09:44:12
你的存款超过了这个数,恭喜,你已迈入真正有钱人的门槛

你的存款超过了这个数,恭喜,你已迈入真正有钱人的门槛

平说财经
2026-01-14 17:52:06
她花了9亿开了场“阴间”演唱会,被举报了,还赔了3亿?

她花了9亿开了场“阴间”演唱会,被举报了,还赔了3亿?

gogoboi
2026-01-14 23:09:15
姆巴佩伤情加剧!经纪人团队发声,三线崩盘在即,皇马后悔了

姆巴佩伤情加剧!经纪人团队发声,三线崩盘在即,皇马后悔了

阿泰希特
2026-01-16 09:03:49
为什么他们可以闻到身上的穷酸味?看完网友评论我真的破防了

为什么他们可以闻到身上的穷酸味?看完网友评论我真的破防了

夜深爱杂谈
2026-01-15 21:07:43
原来王菲没撒谎!公开求助、哽咽落泪的李亚鹏,证实了她当年评价

原来王菲没撒谎!公开求助、哽咽落泪的李亚鹏,证实了她当年评价

冷紫葉
2026-01-15 19:08:26
浙大美女张燕飞去德国学汉学,回中国当博导……

浙大美女张燕飞去德国学汉学,回中国当博导……

吃瓜体
2026-01-13 17:05:24
朱元璋出巡时,遇到当年的地主:当年到你家要饭,为何给我馊饭?

朱元璋出巡时,遇到当年的地主:当年到你家要饭,为何给我馊饭?

五元讲堂
2025-11-06 10:41:50
部队退役我当了狱警,给一个死刑犯剃头时,认出他是失踪多年的队长

部队退役我当了狱警,给一个死刑犯剃头时,认出他是失踪多年的队长

浮生实录集
2025-09-18 15:10:05
确认了!是知名演员张嘉益

确认了!是知名演员张嘉益

看尽落尘花q
2026-01-04 11:55:44
积雪深度超18厘米!河南暴雪时间定了:就在下周一,郑州的雪集中在下午,河南多地有大到暴雪

积雪深度超18厘米!河南暴雪时间定了:就在下周一,郑州的雪集中在下午,河南多地有大到暴雪

鲁中晨报
2026-01-16 07:15:08
人社部表态!2026养老金有望继续调整,今年调整取消挂钩可行吗?

人社部表态!2026养老金有望继续调整,今年调整取消挂钩可行吗?

好贤观史记
2026-01-16 09:51:48
张水华真实水平曝光:世界第471+国内第26 真有底气辞职参赛?

张水华真实水平曝光:世界第471+国内第26 真有底气辞职参赛?

念洲
2026-01-16 08:10:07
既自私,又老欺负人,还不讲卫生,他上《奔跑吧天路篇》干嘛来了

既自私,又老欺负人,还不讲卫生,他上《奔跑吧天路篇》干嘛来了

一娱三分地
2025-12-29 13:14:58
2026-01-16 10:55:00
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
38313文章数 2600640关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

特朗普:对委内瑞拉发动军事袭击计划"泄密者"已被抓

头条要闻

特朗普:对委内瑞拉发动军事袭击计划"泄密者"已被抓

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

汽车要闻

从 "商务" 变 "潮酷" 全新一汽奥迪A6L首秀亮相

态度原创

亲子
健康
房产
家居
公开课

亲子要闻

看来做人不能盲目自信

血常规3项异常,是身体警报!

房产要闻

突发!商业用房购房贷款最低首付比例下调至30%

家居要闻

岁月柔情 现代品质轻奢

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版