网易首页 > 网易号 > 正文 申请入驻

GPT-4o一夜被赶超!Anthropic推出Claude 3.5,网友3分钟克隆马里奥游戏

0
分享至


智东西
编译 李水青
编辑 心缘

一夜之间,刚封神的GPT4o被赶超了。

智东西6月21日报道,昨日晚间,Anthropic推出了新一代大模型Claude 3.5 Sonnet,在多项全球权威测评中一举超越了OpenAI的GPT-4o。


Claude 3.5 Sonnet不仅超过其已发最强模型Claude 3 Opus,在研究生水平的推理 (GPQA)、本科生水平的知识 (MMLU) 和编码能力 (HumanEval)多方面,也都刷新了行业基准。

在速度和成本方面,Claude 3.5 Sonnet是Claude 3 Opus的两倍,加上优惠的价格,它很适合帮用户处理编程、联动程序等复杂任务。

目前,用户可以通过Claude网页和iOS程序免费试用Claude 3.5 Sonnet,付费用户能更高速访问。

同时,客户可通过Anthropic API、Amazon Bedrock和Google Cloud获取该模型。API的收费标准是3美元/每百万输入tokens,15美元/每百万输出tokens,支持200k tokens上下文窗口。


发布之后,Claude 3.5 Sonnet立马在AI圈引起轰动。有网友称,使用Claude 3.5 Sonnet编程比GPT-4o效率高10倍。


有网友3分钟完成了马里奥游戏的克隆版,称最疯狂的是基于最新Artifacs预览功能,一键看到编程应用的预览效果。


Anthropic被视为OpenAI最有力的竞争对手之一,本次Claude 3.5 Sonnet的发布可谓狙击GPT-4o。这是其Claude 3.5的中杯版本,Claude 3.5 Haiku和Claude 3.5 Opus计划今年晚些时候推出。

有一个有意思的细节,在Anthropic的演示视频中出现的演示用户是“Sam”,这似乎是在问候OpenAI的CEO Sam Altman。


官方地址:https://claude.ai/

一、生成2倍速,多项能力赶超GPT-4o

Claude 3.5 Sonnet在其公布的GPQA、MMLU、HumanEval等所有测评中,都超越了OpenAI的GPT-4o,仅数学能力得分略低于GPT-4o。


在AI搜索引擎创企Perplexity的试用评估中,Claude 3.5也获得了优于GPT-4o的表现。Claude 3.5 Sonnet现已在付费AI搜索引擎Perplexity Pro上推出。


在社交媒体X,不少第三方测评团队也给出了试用结论,相比于GPT-4o,Claude 3.5 Sonnet几乎成了推理、语言、编程、数据分析、数学和指令遵循方面的“六边形战士”。


Claude 3.5 Sonnet不仅超过其已发最强模型Claude 3 Opus,在速度和成本方面,Claude 3.5 Sonnet也与Anthropic的中端型号Claude 3 Sonnet旗鼓相当——运行速度是Claude 3 Opus的两倍,成本仅1/5。

在内部代理编码评估中,Claude 3.5 Sonnet成功解决了64%的问题,表现优于仅解决了38%的Claude 3 Opus。在得到指导和相关工具后,Claude 3.5 Sonnet 能够独立编写、编辑和执行代码,并具备复杂的推理和故障排除能力。

有网友在社交平台X贴出使用体验,仅仅25秒,Claude 3.5 Sonnet帮他编写了一个功能整齐的游戏程序。


二、最强视觉模型,多测评超GPT-4o,图表识别能力炸场

Claude 3.5 Sonnet也是Anthropic目前最强大的视觉模型。

它在标准视觉基准测试中超越了Claude 3 Opus。对于需要视觉推理的任务,如解释图表和图形,这些改进尤为显著。此外,Claude 3.5 Sonnet还能准确地从质量不高的图像中转录文本。

如下图所示,在多项权威测评中Claude 3.5 Sonnet超过了GPT-4o,在所有测评中超越了Gemini 1.5 Pro。


如下图所示,Claude 3.5 Sonnet可以快速识别PDF文件内容并输出折线图。


当被继续要求生成网页演示内容,Claude 3.5 Sonnet也可以胜任。


三、颠覆对话式协作,交互升级,四步编程并渲染游戏

现在,Anthropic还将在Claude.ai上推出Artifacts这一新功能,相当于一个预览功能,用以丰富用户与Claude的互动方式。

当用户请求Claude生成代码片段、文本文档或网站设计等内容时,这些Artifacts将在一个专用窗口中与对话一同展示。这为用户提供了一个动态工作区,他们可以实时查看、编辑和构建Claude的创作,将AI生成的内容融入自己的项目和工作流程中。

这一功能的推出标志着Claude从对话式AI向协作式工作环境的进化。

如下图所示,如果要搭建一款游戏并预览效果,用户进需要四个步骤。

首先,输入文本让Claude 3.5 Sonnet生成一个特定大小和风格的角色。


然后,让Claude 3.5 Sonnet为类似风格的视觉要素编程。


紧接着,一个整体的游戏页面被搭建出来,用户可以随时看到代码的生成过程。


最后,就连游戏运行起来的效果,用户也可以通过Artifacts模式进行预览。


在社交媒体X上,有网友称“这太疯狂了”,认为工件+渲染窗口是最佳的编码方式。


作为Anthropic对安全和透明度的承诺,Anthropic最近已将Claude 3.5 Sonnet提供给英国人工智能安全研究所(UK AISI)进行部署前的安全评估,并与美国人工智能安全研究所(US AISI)分享了结果。

Anthropic称其模型开发的核心原则之一是保护隐私。除非用户明确允许,否则Anthropic不会使用用户提交的数据来训练生成模型。Anthropic称其到目前为止未使用任何用户数据来训练生成模型。

结语:OpenAI劲敌出手,追击GPT-4o

Anthropic被认为是OpenAI最强竞争对手之一,Claude 3.5 Sonnet是Claude 3.5系列首款产品,今年晚些时候推出的Claude 3.5 Haiku和Claude 3.5 Opus,是等待OpenAI的后招。

除了研发下一代模型系列,Anthropic还在开发支持企业应用的功能和模式,包括与企业应用程序的集成。Anthropic的团队还在探索诸如“记忆”这样的功能,让Claude能够记住用户的偏好和特定的交互历史,从而提供更加个性化和高效的用户体验。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘亦菲宝格丽之夜,小腹赘肉突出,白臀丰满性感,膀大腰圆引热议

刘亦菲宝格丽之夜,小腹赘肉突出,白臀丰满性感,膀大腰圆引热议

红大娘娱乐
2024-07-20 17:53:03
赶在解放军动手前,赖清德两路人马逃离台湾,大陆或获得收台机会

赶在解放军动手前,赖清德两路人马逃离台湾,大陆或获得收台机会

说天说地说实事
2024-07-19 20:24:57
封了不到半个月,千万粉丝账号“一莎”解封!细数那些与他合作的品牌

封了不到半个月,千万粉丝账号“一莎”解封!细数那些与他合作的品牌

深蓝财经
2024-07-19 16:07:32
女大学生买20粒避孕药,磨粉放入室友碗里:“这是送她们的毕业礼物…”

女大学生买20粒避孕药,磨粉放入室友碗里:“这是送她们的毕业礼物…”

灰产圈
2024-07-20 00:54:04
越南人感慨:要是广东广西没有失守,现在越南已是“发达国家”

越南人感慨:要是广东广西没有失守,现在越南已是“发达国家”

布拉旅游说
2024-07-16 07:15:02
校园霸凌!男孩被同学打致脑出血,打人者满不在乎:我爸是局长!

校园霸凌!男孩被同学打致脑出血,打人者满不在乎:我爸是局长!

拍案说奇
2024-07-20 20:58:45
深夜23点!周琦去向悬念提前终结,广东队最后赢家,剑指第12冠

深夜23点!周琦去向悬念提前终结,广东队最后赢家,剑指第12冠

负角度的球
2024-07-19 20:37:01
遭民生银行追债,祥生杭州总部将被法拍

遭民生银行追债,祥生杭州总部将被法拍

界面新闻
2024-07-20 12:20:39
笑喷!大S发布最新自拍,回应网友疯传的丑照,依旧是美容大王!

笑喷!大S发布最新自拍,回应网友疯传的丑照,依旧是美容大王!

娱乐八卦木木子
2024-07-20 16:30:02
甩锅给下雨?11人遇难30余人失联的柞水大桥,建成通车才不到2年

甩锅给下雨?11人遇难30余人失联的柞水大桥,建成通车才不到2年

谭公子
2024-07-20 19:08:03
第一次知道有钱人的支付宝是黑色,果然贫穷限制了想象力,冒昧了

第一次知道有钱人的支付宝是黑色,果然贫穷限制了想象力,冒昧了

热闹的河马
2024-07-08 10:17:41
李晟医生被砍身亡后续:个人履历曝光好优秀,目击者曝他最后遗言

李晟医生被砍身亡后续:个人履历曝光好优秀,目击者曝他最后遗言

缘浅娱深
2024-07-20 10:40:06
李语蔚拿到培训结业证书,此后或将转正,目前还在杭州指挥交通

李语蔚拿到培训结业证书,此后或将转正,目前还在杭州指挥交通

花小萌和你聊情感
2024-07-20 15:55:56
俞敏洪被绑架细节:被注入兽用麻醉剂,抢走220万,7人仅他幸存…

俞敏洪被绑架细节:被注入兽用麻醉剂,抢走220万,7人仅他幸存…

极品小牛肉
2023-12-29 11:56:11
非洲唯一没有黑人的国家:经济发达美女泛滥,还对中国免签

非洲唯一没有黑人的国家:经济发达美女泛滥,还对中国免签

日风的故事屋
2024-07-18 17:21:43
解气!卡米拉77岁生日英国王室再掀风波 威廉:我就是故意的

解气!卡米拉77岁生日英国王室再掀风波 威廉:我就是故意的

王室叨B叨
2024-07-20 12:04:31
中央宣传部副部长、国务院新闻办公室主任莫高义主持新闻发布会

中央宣传部副部长、国务院新闻办公室主任莫高义主持新闻发布会

金台资讯
2024-07-19 12:09:10
心酸!男子抱怨老婆乱花钱,45块一斤的虾买了3斤,没想到挨批了

心酸!男子抱怨老婆乱花钱,45块一斤的虾买了3斤,没想到挨批了

有趣的火烈鸟
2024-07-19 23:49:12
50岁儿子每天骑10公里去老家拿菜,不去的话父母会很失落:很幸福

50岁儿子每天骑10公里去老家拿菜,不去的话父母会很失落:很幸福

老王侃趣闻
2024-07-19 16:59:15
中国最排面的婴儿:出生时军队保护产房,国家鸣13响礼炮为他庆生

中国最排面的婴儿:出生时军队保护产房,国家鸣13响礼炮为他庆生

杨哥历史
2024-07-17 13:42:46
2024-07-20 22:08:49
智东西
智东西
聚焦智能变革,服务产业升级。
8724文章数 116501关注度
往期回顾 全部

科技要闻

特斯拉因"蓝屏事件"部分停工 马斯克"发火"

头条要闻

上任仅一年 唐山遵化副市长李伟任上被拿下

头条要闻

上任仅一年 唐山遵化副市长李伟任上被拿下

体育要闻

说威少不好,不如先看看掘金啥水平?

娱乐要闻

著名女演员郑佩佩因病离世,享年78岁

财经要闻

微软"蓝屏事件"波及特斯拉工厂

汽车要闻

1548匹! 小米SU7 Ultra原型车10月份挑战纽北

态度原创

时尚
教育
亲子
本地
数码

被这些50+阿姨美到了!烫卷发,穿长裙,一点都没有老气感

教育要闻

这个误区,还没中考的各位务必明白

亲子要闻

一岁多的宝宝还不会说话,却和妈妈吵架?

本地新闻

换个城市过夏天 | 青岛夏日记,一场与海的邂逅

数码要闻

阿斯加特推出博拉琪二代 DDR5 内存:黑白双色可选,海力士 A-die

无障碍浏览 进入关怀版