网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

GPT-4o 不再是最强！Claude 3.5 深夜发布，还免费可用 | 附体验链接

2024-06-21 06:46:54　来源: AppSo

广东举报

0

分享至

蛰伏数月，Anthropic 带着他们最强的 AI 模型——Claude 3.5 Sonnet 来深夜炸街。

「中杯」 Claude 3.5 Sonnet 是 Claude 3.5 系列中的「排头兵」，在大多数基准测试结果中更是优于 GPT-4o。

而这还只是开胃菜，因为官方表示今年晚些时候还会陆续推出 Claude 3.5 Haiku 和 Claude 3.5 Opus 等不同版本，相信届时还将藏着更多惊喜。

Claude 3.5 Sonnet 的特点如下：

更通人性，更能理解细节和复杂指令，创作高质量内容

基准测试结果全方位碾压 Gemini 1.5 Pro 和 Llama-400b，大部分优于 GPT-4o。

速度是 Claude 3 Opus 的两倍，成本仅为后者的五分之一

在自主编码和视觉处理等复杂任务中表现出色

简言之，在 ChatGPT 新模型未发布之前，全世界又将再次迎接 Claude 时代的到来。附上免费试用地址：http://claude.ai

力压 GPT-4o，新皇 Claude 3.5 Sonnet 免费可用

青出于蓝而胜于蓝，全新推出的 Claude 3.5 Sonnet 再次遥遥领先。

从基准测试结果来看，与前代超大杯 Claude 3 Opus 相比，Claude 3.5 Sonnet 以近乎碾压的姿态，轻轻松松就让前浪拍在沙滩上。

Anthropic 表示，Claude 3.5 Sonnet 现在更通人性，更有人味了，在理解细节和复杂指令上做到信手拈来；而且，其在幽默和创作高质量内容方面也有显著进步。

写起文章来就像你的贴心笔友，字字句句都暖到心坎里。

编码能力是 Claude 3.5 Sonnet 进化的重要亮点之一。

在内部的编码评估中，Claude 3.5 Sonnet 可不简单，解决了 64% 的问题。相比之下，老大哥 Claude 3 Opus 只解决了 38%，差距不止一点点。

据 Anthropic 介绍，该编码评估旨在测试模型根据对所需改进的自然语言描述，修复错误或为开源代码库增添新功能的能力。

在接到指令并配备相关工具后，Claude 3.5 Sonnet 就能自己「捣鼓」代码，编写，调试、执行，具备高级的推理和问题解决能力，一套动作下来行云流水。

尤其在软件开发和维护方面，Claude 3.5 Sonnet 不仅效率强，而且可能比人类专家更有效率、更精准。

重点来了，这么能干的模型除了响应速度快，使用成本也很低。

每输入百万 token 只要 3 美元，输出每百万 token 只需 15 美元，故而成本也仅为 Claude 3 Opus 的五分之一。低廉的成本加上 Claude 3.5 Sonnet 在处理多步骤工作任务方面的能力，使其成为这些复杂场景下的首选工具。

Claude 3.5 Sonnet 瞄准的是全球第一 AI 大模型的宝座。

即便和 OpenAI 的 GPT-4o 较劲，Claude 3.5 Sonnet 在纸面参数上也是一点都不虚。

在 GPQA、MGSM 等基准测试上，Claude 3.5 Sonnet 成绩亮眼，将 GPT-4o 甩在后面。而在 MMLU、MATH 等榜单中，Claude 3.5 Sonnet 也只是稍逊或打平于 GPT-4o。

至于面对 Gemini 1.5 Pro 和 Llama-400b 等「老前辈」，Claude 3.5 Sonnet 则是毫无意外地碾压。

前代版本 Claude 3 引入的重要更新就是支持了多模态的能力，而 Claude 3.5 Sonnet 在这方面也是个狠角色。

作为 Anthropic 迄今为止最强大的视觉模型，Claude 3.5 Sonnet 的图像理解能力尤为突出。

上至解读图表图形、下至转录渣画质图像中的文字，通通都是小 case。这种能力也恰恰是零售、物流和金融服务领域稀缺的关键能力。

毕竟零售行业经常需要从商品的包装、标签或收据上读取信息。又比如物流行业需要处理大量的货物标签和运输文件，而这些信息通常是以图像形式存在。

Anthropic 可不想让 Claude 当个安安静静的 AI 聊天机器人，而是要把 Claude 打造成你工作时的得力干将。

因此，Claude 网页端推出了一个名为「Artfacts」的新功能。

简单来说，用户想要 Claude 生成代码片段、文本、或网站设计等内容时，Claude 会直接扔个「Artfacts」窗口给你。

你可以在这些独立窗口中边聊边看边改，将 AI 生成的内容无缝地融入到项目和工作中。

注意彩蛋：「Sam」

另外，团队协作功能也已经在路上了，未来各团队乃至整个组织将能够在一个共享空间中集中管理工作。也就是说，届时 Claude 将彻底化身你的工作搭子。

Anthropic 透露，除了研发下一代模型系列，他们正在开发新的模式和功能，以满足企业更多的应用场景，包括与企业应用程序的整合。

并且，他们还在研究如 Memory（记忆）这样的功能，让 Claude 根据用户指定记住用户的偏好和交互历史，化身你的私人助理。

Claude 3.5 Sonnet 刚登场，就被网友玩坏了

在 Claude 3.5 Sonnet 登场前，Anthropic 特意在社交平台 X 提前打了个哑谜，吊足了公众的胃口。

谜底也随后揭开，Claude 3.5 Sonnet 就这样来到了我们的面前。对于新模型的到来，网友激动之情溢于言表。

OpenAI 前安全主管 Jan Leike 也为 Claude 3.5 Sonnet 背书，言辞间充满赞赏。

X 用户 @genie0309 迫不及待地体验了 Claude 3.5 Sonnet，半分钟的时间，就搭建起一个网站雏形。

网友 @emollick 用 Claude 3.5 Sonnet 做了一个有趣且支持实时编辑的小游戏。

网友让 Claude 3.5 Sonnet 绘制独角兽 SVG 图像，尽管略显抽象，却也别具一格。

Claude 3.5 Sonnet 还在短短 3 分钟内，仅通过几何形状就构建出了一个马里奥的克隆版本，并添加了动画效果。

比 GPT-4o 更强，还更安全

聊到 Anthropic，我们的第一印象是其实力能和 ChatGPT 华山论剑，但又比 OpenAI 更牢牢地将安全二字刻在 AI 里。

Anthropic 透露，Claude 3.5 Sonnet 既「聪明」，也很安全可靠。最终评估结果显示，其安全级别仍维持在 ASL-2 级别。

简单科普一下，ASL-2 是人工智能安全级别（AI Safety Level）体系中的第二级。达到 ASL-2 的 AI 系统具有广泛的风险，但这些风险尚处于可控范围，系统还没有展现出能够造成真正危险的能力。

此外，Anthropic 还请来了一帮包括外部安全专家，对最新模型的安全机制进行了测试和完善。里里外外都查了个遍后，Anthropic 也都参考了反馈以确保模型的安全。

谈到用户最为关心的隐私问题，Anthropic 则表示，除非用户明确授权，否则其不会使用用户提交的数据来训练生成模型。

截至目前，我们尚未使用任何客户或用户提交的数据来训练我们的生成模型。

实际上，这几天，关于 AI 安全的话题在整个 AI 圈卷起了「沙尘暴」。

昨日凌晨，Ilya 官宣成立新公司 SSI，只专注于安全超级智能。至此，最原始的 OpenAI 也因不同理念分裂，大有 Anthropic、OpenAI、SSI 三国鼎立的架势。

在这波涛汹涌中，Anthropic 带着 Claude 3.5 Sonnet 淡定登场。能和 GPT-4o 较量的性能，更安全的 AI，更低的使用成本，新模型性价比高得让人直呼「真香」。

AI 大模型也跟回合制似的，没有永远的王者，只有不断涌现的王者。

发展到今天，GPT-4 刚出道时的震撼已经成了过去式。几乎每一次 Claude 和 ChatGPT 的较量，都总是咬得紧紧的。

至于或许能一锤定音的 GPT-4.5/5，网友们是既期待又无奈。流转的爆料消息，也从「今年夏天」一路「跳票」到年尾，OpenAI 「鸽王」称号都快坐实了。

对比之下，业界清流 Claude 3.5 Sonnet 也给 OpenAI 上了一堂课，原来新品发布是真的可以「现货发售」的。

说来说去，要不 OpenAI 早点推送 GPT-4o 的语音功能？让大家解解馋，也是极好的嘛。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

上海诞生"新币王"5083万元成交目前存世仅七枚

看看新闻Knews 2026-05-11 22:19:07
5363 跟贴 5363
女子快速路上发现1米多大蛇爬行

荔枝新闻 2026-05-12 00:24:18
170 跟贴 170

姚来英已任中国烟草总公司总经理

界面新闻 2026-05-12 11:12:28
3417 跟贴 3417

九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
2879 跟贴 2879
茶颜悦色，装不下去了

中国新闻周刊 2026-05-07 22:15:57
298 跟贴 298

法国新法落地：归还 “260万被抢文物”有多艰难？｜重建现场

新京报动新闻 2026-05-11 01:46:32
792 跟贴 792

“澎湃采访后，副县长实地走访发现问题严重，要求立即全面整改”｜5.56公里高标准农田沟渠的来回“折腾”

澎湃新闻 2026-05-11 22:02:31
300 跟贴 300
温州一企业在芜湖拿地二十年陷困局：区划调整后，原招商承诺难兑现

澎湃新闻 2026-05-12 17:36:28
1 跟贴 1

广州中考名额分配：约11.6万名考生竞争3.2万个名额

南方都市报 2026-05-12 15:40:10
9 跟贴 9
天津一广场“胸口碎大石”表演锤头突然脱把飞出一孩童被砸，当地政府：小朋友没什么大问题

观威海 2026-05-11 21:50:11
1169 跟贴 1169
常州⇆无锡，将全程无红绿灯！

中吴网 2026-05-12 13:59:27
13 跟贴 13
日韩股市集体高开，韩国综指逼近8000点

每日经济新闻 2026-05-12 08:18:57
96 跟贴 96
美股正重演2000年泡沫破灭剧本？“大空头”再发警告：纳指100将迎重大逆转！

财联社 2026-05-12 08:26:12
386 跟贴 386
边门角落“藏污纳垢”引来蚊虫恶臭！街道部门承诺整改

上观新闻 2026-05-12 18:32:15
0 跟贴 0
日经225指数涨幅扩大至1%，最新报63075.44点

每日经济新闻 2026-05-12 08:44:46
88 跟贴 88
杭州一街道疑因退货率太高，居民被多个商家“拉黑”无法下单，当地：正在处理

极目新闻 2026-05-12 10:07:39
254 跟贴 254
“人工胚胎”，首次进入太空！

环球网资讯 2026-05-12 07:46:13
38 跟贴 38
曝国际足联愿大幅降低版权要价，从3亿美元降至1.2亿-1.5亿

新快报新闻 2026-05-12 02:33:08
315 跟贴 315
重庆交通执法部门调解维修纠纷车主获退一赔三

极目新闻 2026-05-12 18:31:51
0 跟贴 0
乌兰察布一空置房莫名水费600余元，督查组：计费系统异常

澎湃新闻 2026-05-12 18:34:13
0 跟贴 0
打破常规国内航线燃油附加费5月16日起再上调

财联社 2026-05-12 16:55:15
0 跟贴 0
党建引领“三访三全”，下水纠纷圆满化解 | 东盐路社区“言和调解室”解开邻里“心结”

大沽街道 2026-05-12 18:36:47
0 跟贴 0
榴莲能“配酒”吃吗？权威提醒来了→

中国消费者报 2026-05-12 18:16:19
0 跟贴 0

暗示退役？转播方在湖人G4落后期间突然晒出詹姆斯生涯荣誉

暗示退役？转播方在湖人G4落后期间突然晒出詹姆斯生涯荣誉

林子说事

2026-05-12 13:29:24

欧盟为什么不愿中国储存粮食？看印度一番神操作，一切都清楚了

欧盟为什么不愿中国储存粮食？看印度一番神操作，一切都清楚了

阅微札记

2026-05-10 11:46:09

山东25岁女子征婚被网友群嘲，奇葩要求让人无语至极

山东25岁女子征婚被网友群嘲，奇葩要求让人无语至极

映射生活的身影

2026-05-12 10:44:30

范佩西回应记者：下赛季我还是费耶诺德的教练，你们满意了吧

范佩西回应记者：下赛季我还是费耶诺德的教练，你们满意了吧

懂球帝

2026-05-12 11:59:02

升值破新高，高盛放话人民币被低估20%

升值破新高，高盛放话人民币被低估20%

罗富强说

2026-05-12 17:41:35

热搜第一！“一拳能锤倒砖墙”，宇树震撼发布首款载人机甲，半吨重还可变形，390万元起！视频公布，王兴兴坐进GD01

热搜第一！“一拳能锤倒砖墙”，宇树震撼发布首款载人机甲，半吨重还可变形，390万元起！视频公布，王兴兴坐进GD01

每日经济新闻

2026-05-12 14:58:10

侃爷被曝是同性恋！前妻金卡戴珊的前男友公开嘲讽

侃爷被曝是同性恋！前妻金卡戴珊的前男友公开嘲讽

小椰的奶奶

2026-05-12 18:04:23

陕西延安通报：已对薛某作出停职待查处理

陕西延安通报：已对薛某作出停职待查处理

政知新媒体

2026-05-12 08:21:18

他是著名演员，从发病到去世仅20分钟，主持人儿子比他更有名

他是著名演员，从发病到去世仅20分钟，主持人儿子比他更有名

削桐作琴

2026-03-21 15:03:45

丑鞋出海卖爆了，卖家狂赚400万

丑鞋出海卖爆了，卖家狂赚400万

跨境派Pro

2026-05-09 14:14:21

释永信被一女子爆料：她们姐妹住少林寺3天，争着往释永信房间跑

释永信被一女子爆料：她们姐妹住少林寺3天，争着往释永信房间跑

江山挥笔

2026-03-23 15:40:31

一个日本兵的亲诉：苏军进攻关东军时，我看见人间地狱的真实模样

一个日本兵的亲诉：苏军进攻关东军时，我看见人间地狱的真实模样

掠影后有感

2026-05-11 11:20:00

奶奶刚死3天，瞎子上门讨饭，临走时说：明天你们家要多一口棺材

奶奶刚死3天，瞎子上门讨饭，临走时说：明天你们家要多一口棺材

千秋文化

2026-04-27 20:12:24

可以凑一套首发，世体：巴萨近11人有机会进西班牙世界杯名单

可以凑一套首发，世体：巴萨近11人有机会进西班牙世界杯名单

懂球帝

2026-05-12 15:21:09

人民币78岁了！你见没见过的人民币，都在这里！

人民币78岁了！你见没见过的人民币，都在这里！

中国艺术家

2026-05-12 05:24:45

美国突曝海量UFO文件！中国三大经典UFO事件：萧山机场真相颠覆！

美国突曝海量UFO文件！中国三大经典UFO事件：萧山机场真相颠覆！

大稻网络科技

2026-05-09 09:29:34

美媒再曝特朗普随行名单：17巨头组"商业天团"，唯独缺了那个人

美媒再曝特朗普随行名单：17巨头组"商业天团"，唯独缺了那个人

听心堂

2026-05-12 11:08:28

张艺谋新剧《主角》爆火，张嘉益刘浩存表现平平，37岁女配却出圈

张艺谋新剧《主角》爆火，张嘉益刘浩存表现平平，37岁女配却出圈

冷紫葉

2026-05-11 18:12:37

中纪委划红线：严查公务员出现这5种行为，触碰将一律严肃处理

中纪委划红线：严查公务员出现这5种行为，触碰将一律严肃处理

细说职场

2026-05-06 14:21:03

越南新总理催促赌场KTV尽快落实到位加速发展

越南新总理催促赌场KTV尽快落实到位加速发展

斜烟风起雨未

2026-05-12 18:13:11

让智能手机更好用的秘密

6372文章数 26832关注度

往期回顾全部

科技要闻

宇树发布载人变形机甲，定价390万元起

头条要闻

为见女儿最后一面老人第一次坐高铁买不到票求助特警

头条要闻

为见女儿最后一面老人第一次坐高铁买不到票求助特警

体育要闻

总是掉链子的“倒霉蛋”，闯进了欧战决赛

娱乐要闻

刘涛晒妈祖诞辰活动照评论区变许愿池

财经要闻

黄仁勋真是被白宫彻底封杀了

汽车要闻

吉利银河“TT”申报图曝光电动尾翼+激光雷达

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

房产

本地

公开课

军事航空

亲子要闻

最好的陪伴是陪你慢慢长大今日份温馨时刻和我的小棉袄合唱一曲

房产要闻

穗八条引爆楼市！万博宝藏红盘，五一劲销出圈

本地新闻

用苏绣的方式，打开江西婺源

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

知情人士披露：美国或考虑恢复对伊朗军事行动

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版