网易首页 > 网易号 > 正文 申请入驻

Claude Haiku 4.5来了,速度更快,成本仅为Sonnet 4的1/3

0
分享至




机器之心报道

机器之心编辑部

距离上次新品发布仅仅两周后,Anthropic 又出手了。

最新消息,Anthropic 发布轻量级模型 Claude Haiku 4.5,主打「更便宜、更快速」。

据 Anthropic 介绍,Claude Haiku 4.5 的编码性能可与中高端模型 Claude Sonnet 4(这是 Anthropic 于 5 个月前发布的模型)相媲美,但成本更低,每百万输入 token 的成本为 1 美元,每百万输出 token 的成本为 5 美元,仅为 Claude Sonnet 4 的三分之一。而推理速度却提升一倍多。



用 Anthropic 发言人的话来说就是,「Haiku 4.5 在性能上有了明显的飞跃,现在基本上和 Sonnet 4 一样智能,但速度却快得多,成本却只有 Sonnet 4 的三分之一。」

不仅如此,从测试数据来看,Claude Haiku 4.5 在某些任务,甚至超越了 Claude Sonnet 4。比如 computer use 「OSWorld」(一个在现实世界计算机任务中测试人工智能模型的基准测试平台)上,前者得分 50.7%,后者得分 42.2%;数学推理(AIME 2025)测试中,前者借助 Python 工具,成绩高达 96.3%,后者为 70.5%。



整体来看,Claude Haiku 4.5 核心面向实时、低延迟的任务场景,比如聊天助手、客服人员、协同编程等。这些场景用户将会体验到 Claude Haiku 4.5 的高智能、极快速度。而 Claude Code 用户则会发现 Claude Haiku 4.5 显著提升了编码体验的响应速度,包括多智能体项目到快速原型开发设计等。

早期客户的一些体验评价也体现了 Claude Haiku 4.5 的能力水平:

比如,Augment Code 的联合创始人 Guy Gur-Ari 表示,「Claude Haiku 4.5 达到了我们意想不到的最佳状态:接近前沿的编码质量、惊人的速度和成本效益。在 Augment 的内部编码评估测试中,Haiku 4.5 的性能达到了 Sonnet 4.5 的 90%,甚至可以与规模更大的模型相媲美。」



Windsurf 的首席执行官 Jeff Wang 也表示,「历史上,模型总是为了质量而牺牲速度和成本,而Haiku 4.5 正在「模糊」这种传统权衡的界限:它是一种快速的前沿模型,既保持了成本高效,又预示了这类模型的发展方向。」



其实,从测试数据上也不难看出,目前,Claude Sonnet 4.5 仍然是 Anthropic 最好的模型,在各项性能表现上都超过 Claude Haiku 4.5,而 Claude Haiku 4.5 的长处在于能以更高的成本效益为用户提供「近乎前沿的性能」。

另外,Anthropic 表示,两者的配合使用还将为企业客户带来极大优势:前者可以构建前沿多步骤计划,而后者则并行完成子任务,「从而支持多智能体系统快速高质量地处理复杂的重构、迁移和大型功能构建。」

比如,在金融服务领域,Claude Sonnet 4.5 和 Haiku 4.5 的结合所带来的多智能体架构,将彻底改变企业监控市场和管理风险的方式。在 Anthropic 的设想中,Haiku 4.5 将同时监控数千个数据流 —— 追踪监管变化、市场信号和投资组合风险,而 Sonnet 4.5 则负责处理复杂的预测模型和战略分析。

而对于研究机构来说,分工可以大幅压缩时间。比如,Claude Sonnet 4.5 可以协调全面的分析,而多个 Haiku 4.5 Agent 则可以并行处理数十个来源的文献综述、数据收集和文档合成,根据 Anthropic 的描述,这可能「将数周的研究压缩到数小时」。

还有一点非常重要的是,Claude Haiku 4.5 不仅速度快、价格低,而且安全。

Anthropic 表示,他们对 Claude Haiku 4.5 进行了一系列详细的安全性和一致性评估,结果显示,该模型表现出较低的令人担忧的行为发生率,并且比其前身 Claude Haiku 3.5 的一致性显著提高。而在自动一致性评估中,Claude Haiku 4.5 的总体偏差行为发生率也显著低于 Claude Sonnet 4.5 和 Claude Opus 4.1。

因此,根据这一指标,Claude Haiku 4.5 可以堪称是他们「迄今为止最安全的模型。」

所以综合来看,Claude Haiku 4.5 是目前 Anthropic「更快、性价比更高、更安全」的模型版本。

目前,Claude Haiku 4.5 已在全球上线,作为 Claude Haiku 3.5 与 Sonnet 4 的「直接替代品」,用户可通过 Claude 官方平台、API 接口,以及亚马逊 Bedrock、Google Cloud Vertex AI 等云服务渠道访问使用。

业界的朋友应该感受到了,最近 Anthropic 真是动作频频,两个月内接连发布三大 AI 模型,「太卷了」。

今年 8 月上旬,Anthropic 发布新模型 Opus 4.1,在编程评估基准 SWE-Bench Verified 上得分达到 74.5%,较 Opus 4 的 72.5% 提升两个百分点。

紧接着,9 月 30 日,重磅发布了自诩为「世界上最好的编码模型」的 Claude Sonnet 4.5。之后就是两周后的今天,再次带来新模型,自己卷自己。

而有意思的是,最近有报道传出,Anthropic 到今年年底有望实现 90 亿美元的年化营收目标,此外,更是明年设定了更激进的「小目标」:基准情况下年化营收超过 200 亿美元,最佳情况下可达 260 亿美元,相当于今年营收的近两倍。而据 Anthropic 的发言人在接受媒体采访时透露,Anthropic 本月的年化营收正接近 70 亿美元……

似乎「自卷」的理由找到了……

https://www.anthropic.com/news/claude-haiku-4-5

https://venturebeat.com/ai/anthropic-is-giving-away-its-powerful-claude-haiku-4-5-ai-for-free-to-take

https://x.com/claudeai/status/1978505436358697052

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
莱温斯基:1995年,我的蓝裙子被总统克林顿脱下,就在白宫办公室

莱温斯基:1995年,我的蓝裙子被总统克林顿脱下,就在白宫办公室

老谢谈史
2026-01-16 13:21:23
为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

以茶带书
2026-01-14 21:54:28
美国在加勒比海强扣又一艘油轮

美国在加勒比海强扣又一艘油轮

新华社
2026-01-15 23:26:05
四川凉山15岁少年半年前疑被骗至柬埔寨,失联前曾发求救视频,母亲:他为了攒钱给自己治眼睛,当地警方已介入

四川凉山15岁少年半年前疑被骗至柬埔寨,失联前曾发求救视频,母亲:他为了攒钱给自己治眼睛,当地警方已介入

扬子晚报
2026-01-15 21:27:04
世上没有后悔药!任素汐,终究为自己的行为买了单

世上没有后悔药!任素汐,终究为自己的行为买了单

巧手晓厨娘
2026-01-16 15:44:12
安徽小伙在小国家创业,“享受”一夫多妻、开放生活的他如今怎样

安徽小伙在小国家创业,“享受”一夫多妻、开放生活的他如今怎样

牛牛叨史
2026-01-06 12:59:43
中国财政供养人员达6846万?结构失衡才是财政压力的核心

中国财政供养人员达6846万?结构失衡才是财政压力的核心

流苏晚晴
2025-12-04 19:27:08
委内瑞拉全国都在找的“内鬼”,竟是总统的亲密“发小”

委内瑞拉全国都在找的“内鬼”,竟是总统的亲密“发小”

上观新闻
2026-01-15 06:55:26
球队的进攻如此混乱,结果火箭却让全队唯一一名控卫去蹲底角?

球队的进攻如此混乱,结果火箭却让全队唯一一名控卫去蹲底角?

稻谷与小麦
2026-01-16 16:12:40
你们可能被特朗普骗了,特朗普有可能真的是美国最伟大的总统

你们可能被特朗普骗了,特朗普有可能真的是美国最伟大的总统

流苏晚晴
2026-01-10 16:24:45
李湘全网账号被禁止关注,网友三大猜测:炫富、税务、少林寺?

李湘全网账号被禁止关注,网友三大猜测:炫富、税务、少林寺?

乌娱子酱
2026-01-16 15:40:03
美媒通告全球:歼-20飞越台岛上空,台军根本抓不到,统一成定局

美媒通告全球:歼-20飞越台岛上空,台军根本抓不到,统一成定局

议纪史
2026-01-15 11:40:08
完全错误的用人方式!火箭为什么非要让后场新星担任先发控卫呢?

完全错误的用人方式!火箭为什么非要让后场新星担任先发控卫呢?

稻谷与小麦
2026-01-16 15:27:01
赵露思透明衬衫惹火!吊带下的雪肌蜂腰,这身材太顶了?

赵露思透明衬衫惹火!吊带下的雪肌蜂腰,这身材太顶了?

娱乐领航家
2026-01-12 22:00:03
高约300米!浙江县域第一高楼诞生!

高约300米!浙江县域第一高楼诞生!

GA环球建筑
2026-01-16 00:14:21
27000余人的野战纵队,装备148挺重机枪,具体配置怎么样?

27000余人的野战纵队,装备148挺重机枪,具体配置怎么样?

云霄纪史观
2026-01-16 14:53:05
斯诺克赛程:决出4强,2大世界冠军PK,吴宜泽德比战对阵肖国栋!

斯诺克赛程:决出4强,2大世界冠军PK,吴宜泽德比战对阵肖国栋!

刘姚尧的文字城堡
2026-01-16 07:04:01
娶了朋友前妻是一种什么样的体验?

娶了朋友前妻是一种什么样的体验?

另子维爱读史
2026-01-13 20:04:40
观致常熟工厂二拍,缴了1.7亿保证金的神秘买家是谁?

观致常熟工厂二拍,缴了1.7亿保证金的神秘买家是谁?

深水财经社
2026-01-15 14:24:40
陈亭妃逆转出线跌破眼镜?国民党:赖清德在台南已不得人心

陈亭妃逆转出线跌破眼镜?国民党:赖清德在台南已不得人心

海峡导报社
2026-01-15 16:00:02
2026-01-16 16:48:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12133文章数 142542关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

艺术
旅游
本地
时尚
公开课

艺术要闻

300亿!341米!迪拜将建全球首个奔驰品牌城市

旅游要闻

免费领花!闵行这个年宵花市集火爆返场~

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

年度最扎心电影,看得中年男女坐立难安

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版