网易首页 > 网易号 > 正文 申请入驻

Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5

0
分享至


就在刚刚,Anthropic 发布了 Claude Haiku 4.5。

先简单科普一下,Claude 家族有三个不同参数量级的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。

这次更新最大的看点是,小杯 Claude Haiku 4.5 在模型性能保持高水准的同时,速度更快、价格更便宜了

五个月前,Claude Sonnet 4 还是最先进的模型之一。现在新出的 Haiku 4.5 在编码性能上几乎和它打平手,但价格只要三分之一,速度还翻了两倍多。


▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具体来说,在用于衡量 AI 编码能力的测试集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成绩,什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平线上。

在某些任务比如操控电脑方面,Haiku 4.5 甚至反杀了老大哥 Sonnet 4。

对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或结对编程助手,Haiku 4.5 兼具高智能和出色速度,能带来更好的体验。

使用 Claude Code 的开发者也会发现,Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更灵敏高效。


当然,两周前发的 Sonnet 4.5 依然是 Anthropic 的旗舰模型,归属全球编程模型第一档次。但 Haiku 4.5 提供了另一个选项:性能接近顶配,价格却亲民得多。

而且模型玩法更野了,Sonnet 4.5 可以把复杂问题拆成 N 个小任务,然后指挥一堆 Haiku 4.5 并行开工,这配合相当默契。

Anthropic 对 Haiku 4.5 进行了详细的安全性和对齐性测试。

结果显示,该模型的不良行为发生率较低,且比前代 Haiku 3.5 的对齐性显著提高。在自动化对齐评估中,Haiku 4.5 的总体偏离行为比 Sonnet 4.5 和 Opus 4.1 都更少。

也就是说,它目前是 Anthropic 家最安全的模型。


▲Comparison table of frontier models across popular benchmarks

至于价格嘛...Haiku 4.5 的定价为:每百万输入 token 1 美元,每百万输出 token 5 美元。

对比来看,GPT-5 mini 约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 价格差不多。也就是说,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。

不过跟 Sonnet 4.5 比,它便宜了约三倍,性能却几乎没差,这对开发者来说算是降本增效了。

但有一说一,数学不是它的强项。

知名博主 Dan Shipper 试用后发现,Haiku 在算术上有点... 迷糊。

比如在测试 Uber 账单的例子里,Haiku 虽然完美找出了所有相关邮件,但算总额时直接翻车。更尴尬的是,指出错误后它承认了——然后转头又犯了同样的错

Dan Shipper 给出的中肯评价是:

如果你是开发者或创业者,正在用 Sonnet 4.5 构建复杂的智能代理应用,现在可以考虑切换到 Haiku。你能节省大量成本,而性能损失几乎可以忽略。 如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建议试试 Haiku。虽然价格更高一些,但在需要调用工具和保持自主性的场景中,它的表现更好。


▲附上博客地址:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 现已在 Claude Code 和各类应用中上线了。

开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且价格是 Anthropic 最香的那档。


我们参考@zb1992 的提示词,让 Claude 4.5 Haiku 跑了一个钟表 Demo,整体体验下来,代码生成速度确实更快了,最终成品也令人满意。

在下文这个经典的推理计算题, Claude 4.5 Haiku 响应速度优势就更明显了,当然,这也正是轻量级模型在实际应用中的核心竞争力所在。


另外,据 The Information 报道,估值高达 1700 亿美元的 Anthropic 近几周已告诉投行顾问,计划通过收购引入更多技术人才,同时拓展除编程助手之外的能力——毕竟目前编程这块还是营收大头。


知情人士表示,鉴于 Anthropic 在向开发者提供编程类 AI 产品方面取得的成功,公司下一步可能会扩展至其他开发者常用的软件工具,比如自动测试代码漏洞的工具,或辅助软件设计的工具。

另有消息称,Anthropic 也可能通过收购开发面向特定行业的产品,例如金融服务、医疗保健或网络安全,不过他们更倾向于交易金额在 5 亿美元以下的小型收购项目。

目前看起来,在提升模型能力的同时,Anthropic 也在积极布局生态。AI 圈的你追我赶,最终受益的还是开发者和用户——更强的模型、更低的价格、更多的选择。

作者:莫崇宇

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“台独”沈伯洋被立案 郭正亮:全台几百万人鼓掌

“台独”沈伯洋被立案 郭正亮:全台几百万人鼓掌

看看新闻Knews
2025-11-02 00:17:04
价格暴跌,商家:预计还要降

价格暴跌,商家:预计还要降

鲁中晨报
2025-11-01 22:31:04
爱奇艺借钱逾期一天,市民称收到“威胁”催收短信,爱奇艺:仅提供借款平台;小芽贷:会有温馨提醒短信

爱奇艺借钱逾期一天,市民称收到“威胁”催收短信,爱奇艺:仅提供借款平台;小芽贷:会有温馨提醒短信

中国能源网
2025-11-02 10:49:03
两岸统一后,赖清德将受到如何对待?国防部一句话让网友心安了

两岸统一后,赖清德将受到如何对待?国防部一句话让网友心安了

通鉴史智
2025-11-01 07:50:16
斯诺克国锦赛:赵心童、肖国栋顺利晋级,奥沙利文6-5绝杀

斯诺克国锦赛:赵心童、肖国栋顺利晋级,奥沙利文6-5绝杀

懂球帝
2025-11-02 18:45:07
参加蔡英文、赖清德就职,却不出席郑丽文就职,卢秀燕真面目曝光

参加蔡英文、赖清德就职,却不出席郑丽文就职,卢秀燕真面目曝光

蛙斯基娱乐中
2025-11-02 16:27:24
王浩任渭南市委书记

王浩任渭南市委书记

新京报政事儿
2025-11-01 23:21:45
你做过最疯狂的事是什么?网友:在公园亲了一小时

你做过最疯狂的事是什么?网友:在公园亲了一小时

解读热点事件
2025-10-11 00:20:03
难以置信!催收太丧心病狂了,重庆一公司把巡特警大队催停摆…

难以置信!催收太丧心病狂了,重庆一公司把巡特警大队催停摆…

火山诗话
2025-11-01 14:30:06
张柏芝合照也太夸张了吧!宁静,刘嘉玲都被她比下去了

张柏芝合照也太夸张了吧!宁静,刘嘉玲都被她比下去了

手工制作阿歼
2025-11-02 13:43:13
王家卫好样的,这下全网都知道唐嫣洁身自好了

王家卫好样的,这下全网都知道唐嫣洁身自好了

娱乐故事
2025-11-01 21:36:09
高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

古怪奇谈录
2025-10-16 10:53:42
国补确认恢复继续!国补政策2025年最新消息:新一轮国补690亿11月发放领取中,国补截止到年底结束

国补确认恢复继续!国补政策2025年最新消息:新一轮国补690亿11月发放领取中,国补截止到年底结束

中国润滑油信息网
2025-11-02 15:48:57
84年我立下一等功,军长做媒把独生女介绍给我,一见面她就踹我一脚

84年我立下一等功,军长做媒把独生女介绍给我,一见面她就踹我一脚

如烟若梦
2025-10-30 16:12:15
山姆又出事了!APP现不雅照,顾客隐私全部暴露

山姆又出事了!APP现不雅照,顾客隐私全部暴露

台州交通广播
2025-11-01 17:55:50
黄仁勋在韩国的两天,都留给了一家炸鸡店

黄仁勋在韩国的两天,都留给了一家炸鸡店

小鬼头体育
2025-11-01 12:16:23
灰熊官宣禁赛莫兰特1场!声称行为造成不利影响 薪金损失27万美元

灰熊官宣禁赛莫兰特1场!声称行为造成不利影响 薪金损失27万美元

罗说NBA
2025-11-02 05:43:24
许绍雄追悼会确定!家属呼吁亲友,别送花篮直接给钱,目的太感人

许绍雄追悼会确定!家属呼吁亲友,别送花篮直接给钱,目的太感人

一只番茄鱼
2025-10-31 22:46:33
为何美军在上甘岭战役中没像对付日军那样,用喷火器对着坑道喷?

为何美军在上甘岭战役中没像对付日军那样,用喷火器对着坑道喷?

老范谈史
2025-11-01 19:59:54
56岁张也被问“不结婚怎么解决需求”,她的回答让全网沉默

56岁张也被问“不结婚怎么解决需求”,她的回答让全网沉默

橙星文娱
2025-11-02 12:26:47
2025-11-02 19:44:49
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
37965文章数 2600068关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

19岁男生被邻居驾车故意撞死 事发时再过几天就要高考

头条要闻

19岁男生被邻居驾车故意撞死 事发时再过几天就要高考

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

房产
旅游
数码
公开课
军事航空

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

旅游要闻

可爱的乡村——房前村后尽青山

数码要闻

64GB×4 6000CL30 套条 12999 元,Origin Code VORTEX 内存上架

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄在日本海演习击沉假想敌潜艇

无障碍浏览 进入关怀版