网易首页 > 网易号 > 正文 申请入驻

Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5

0
分享至

来源:市场资讯

(来源:爱范儿)

就在刚刚,Anthropic 发布了 Claude Haiku 4.5。

先简单科普一下,Claude 家族有三个不同参数量级的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。

这次更新最大的看点是,小杯 Claude Haiku 4.5 在模型性能保持高水准的同时,速度更快、价格更便宜了。

五个月前,Claude Sonnet 4 还是最先进的模型之一。现在新出的 Haiku 4.5 在编码性能上几乎和它打平手,但价格只要三分之一,速度还翻了两倍多。


▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具体来说,在用于衡量 AI 编码能力的测试集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成绩,什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平线上。

在某些任务比如操控电脑方面,Haiku 4.5 甚至反杀了老大哥 Sonnet 4。

对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或结对编程助手,Haiku 4.5 兼具高智能和出色速度,能带来更好的体验。

使用 Claude Code 的开发者也会发现,Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更灵敏高效。

当然,两周前发的 Sonnet 4.5 依然是 Anthropic 的旗舰模型,归属全球编程模型第一档次。但 Haiku 4.5 提供了另一个选项:性能接近顶配,价格却亲民得多。

而且模型玩法更野了,Sonnet 4.5 可以把复杂问题拆成 N 个小任务,然后指挥一堆 Haiku 4.5 并行开工,这配合相当默契。

Anthropic 对 Haiku 4.5 进行了详细的安全性和对齐性测试。

结果显示,该模型的不良行为发生率较低,且比前代 Haiku 3.5 的对齐性显著提高。在自动化对齐评估中,Haiku 4.5 的总体偏离行为比 Sonnet 4.5 和 Opus 4.1 都更少。

也就是说,它目前是 Anthropic 家最安全的模型。


▲Comparison table of frontier models across popular benchmarks

至于价格嘛...Haiku 4.5 的定价为:每百万输入 token 1 美元,每百万输出 token 5 美元。

对比来看,GPT-5 mini 约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 价格差不多。也就是说,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。

不过跟 Sonnet 4.5 比,它便宜了约三倍,性能却几乎没差,这对开发者来说算是降本增效了。

但有一说一,数学不是它的强项。

知名博主 Dan Shipper 试用后发现,Haiku 在算术上有点... 迷糊。

比如在测试 Uber 账单的例子里,Haiku 虽然完美找出了所有相关邮件,但算总额时直接翻车。更尴尬的是,指出错误后它承认了——然后转头又犯了同样的错

Dan Shipper 给出的中肯评价是:


▲附上博客地址:

https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 现已在 Claude Code 和各类应用中上线了。

开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且价格是 Anthropic 最香的那档。


我们参考@zb1992 的提示词,让 Claude 4.5 Haiku 跑了一个钟表 Demo,整体体验下来,代码生成速度确实更快了,最终成品也令人满意。

在下文这个经典的推理计算题, Claude 4.5 Haiku 响应速度优势就更明显了,当然,这也正是轻量级模型在实际应用中的核心竞争力所在。


另外,据 The Information 报道,估值高达 1700 亿美元的 Anthropic 近几周已告诉投行顾问,计划通过收购引入更多技术人才,同时拓展除编程助手之外的能力——毕竟目前编程这块还是营收大头。


知情人士表示,鉴于 Anthropic 在向开发者提供编程类 AI 产品方面取得的成功,公司下一步可能会扩展至其他开发者常用的软件工具,比如自动测试代码漏洞的工具,或辅助软件设计的工具。

另有消息称,Anthropic 也可能通过收购开发面向特定行业的产品,例如金融服务、医疗保健或网络安全,不过他们更倾向于交易金额在 5 亿美元以下的小型收购项目。

目前看起来,在提升模型能力的同时,Anthropic 也在积极布局生态。AI 圈的你追我赶,最终受益的还是开发者和用户——更强的模型、更低的价格、更多的选择。

作者:莫崇宇

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国油轮在霍尔木兹海峡硬闯美军封锁线!第二次,被堵回来了!

中国油轮在霍尔木兹海峡硬闯美军封锁线!第二次,被堵回来了!

菁菁子衿
2026-04-15 20:01:47
太狗血!许家印再传大瓜!

太狗血!许家印再传大瓜!

财经要参
2026-04-15 18:30:42
美军神话破灭!巴空军进入辉煌时刻,6架空警500,40架J-35A进驻

美军神话破灭!巴空军进入辉煌时刻,6架空警500,40架J-35A进驻

军机Talk
2026-04-15 16:26:50
0-2日本引发连锁反应!比输球可怕的是,中国女足二十年逢日不胜

0-2日本引发连锁反应!比输球可怕的是,中国女足二十年逢日不胜

大秦壁虎白话体育
2026-04-15 23:33:30
震惊!白发老人高铁上办公被调侃“高端牛马”,身旁女助理引关注

震惊!白发老人高铁上办公被调侃“高端牛马”,身旁女助理引关注

火山詩话
2026-04-15 06:12:38
5月1日起严打!8类灰色行为入刑,人人都要心中有数

5月1日起严打!8类灰色行为入刑,人人都要心中有数

混沌录
2026-04-14 20:16:16
谁能想到,苏林上任首访中国,竟是自家人都摆不平的大麻烦

谁能想到,苏林上任首访中国,竟是自家人都摆不平的大麻烦

动物奇奇怪怪
2026-04-15 13:19:42
4-3!0-0!拜仁逆转淘汰皇马,阿森纳进4强,利雅得胜利险胜

4-3!0-0!拜仁逆转淘汰皇马,阿森纳进4强,利雅得胜利险胜

足球狗说
2026-04-16 05:16:26
王博被驱逐!三大核心缺席广厦惜败山西 布朗空砍41分

王博被驱逐!三大核心缺席广厦惜败山西 布朗空砍41分

醉卧浮生
2026-04-15 21:51:38
炸穿台湾政坛!蒋友松强行迁走两蒋悬棺,半世纪漂泊终要归乡

炸穿台湾政坛!蒋友松强行迁走两蒋悬棺,半世纪漂泊终要归乡

陈漎侃故事
2026-04-14 17:28:18
后续!孕妇200买水果被老公骂:已去医院终止妊娠 老公发怒砸东西

后续!孕妇200买水果被老公骂:已去医院终止妊娠 老公发怒砸东西

小鋭有话说
2026-04-14 08:37:44
美军二战以来首次发动潜艇袭击,事发斯里兰卡以南海域,87名伊朗海军身亡,32名幸存者已启程回国

美军二战以来首次发动潜艇袭击,事发斯里兰卡以南海域,87名伊朗海军身亡,32名幸存者已启程回国

极目新闻
2026-04-15 09:15:05
美军布什号航母及1.02万士兵将抵达中东,特朗普:战争“即将结束”,也可能持续至11月!超2400万伊朗人登记志愿为国捐躯,伊总统五问美国

美军布什号航母及1.02万士兵将抵达中东,特朗普:战争“即将结束”,也可能持续至11月!超2400万伊朗人登记志愿为国捐躯,伊总统五问美国

鲁中晨报
2026-04-15 21:53:08
A股迎重磅新政:三十年来首次延长交易时长,牛市要来了

A股迎重磅新政:三十年来首次延长交易时长,牛市要来了

人生录
2026-04-15 16:18:11
年销10亿的网红“宋柚汁”,“宋柚”是商标,柚含量仅2.7%,厂家回应

年销10亿的网红“宋柚汁”,“宋柚”是商标,柚含量仅2.7%,厂家回应

澎湃新闻
2026-04-15 15:56:22
国台办:统一后台湾财政税收全用于民生,无需在防务上花巨资

国台办:统一后台湾财政税收全用于民生,无需在防务上花巨资

南方都市报
2026-04-15 16:48:15
0-2!中国女足出局,亚洲杯决赛对阵出炉:日本女足对决朝鲜女足

0-2!中国女足出局,亚洲杯决赛对阵出炉:日本女足对决朝鲜女足

足球狗说
2026-04-15 22:54:41
采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

千秋文化
2026-04-15 20:18:32
不想访华了?特朗普召回美驻华大使,贝森特扬言:中国“不可靠”

不想访华了?特朗普召回美驻华大使,贝森特扬言:中国“不可靠”

影孖看世界
2026-04-15 22:29:46
杨某媛称已找到工作,结果立马被网友举报了……

杨某媛称已找到工作,结果立马被网友举报了……

麦杰逊
2026-04-15 11:53:46
2026-04-16 05:28:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2879829文章数 6652关注度
往期回顾 全部

科技要闻

ChatGPT十亿用户又怎样?Anthropic直接贴脸

头条要闻

法国全票通过 “将不义之财归还中国”

头条要闻

法国全票通过 “将不义之财归还中国”

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

谢娜现身环球影城,牵手女儿温馨有爱

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

空间丝毫不用妥协 小鹏GX首发评测

态度原创

家居
手机
亲子
健康
公开课

家居要闻

简而不减 暖居之道

手机要闻

一加Ace6至尊版再次被确认:魔改天玑9500+165Hz屏,本月发布!

亲子要闻

孕妇200买水果被骂后续:已终止妊娠,男方崩溃砸东西,网友炸锅

干细胞抗衰4大误区,90%的人都中招

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版