网易首页 > 网易号 > 正文 申请入驻

四大维度深度体验,GPT-4o为何被称作“最强大模型”;OpenAI超级对齐团队“分崩离析”,年内已9人离职;道指站上40000点,《大空头》原型继续看...

0
分享至



●当地时间5月13日,GPT-4o震撼发布,阿尔特曼称其为OpenAI“有史以来最好的模型”。到底有多厉害?又是如何“炼”成的?《每日经济新闻》记者从4大维度进行测评。

●本周,OpenAI首席科学家苏茨克沃和他的亲信莱克双双离职。此外,他们共同领导的“超级智能对齐团队”也在周五被证实解散。年初至今公司已有9人离职。

●《大空头》原型继续看涨中概股;脑机试验招募第二名患者;更多内容,尽在《一周国际财经》。



四大维度深度体验多模态性能,GPT-4o为何被称作“最强大模型”?


图片来源:发布会视频截图

去年3月,GPT-4震撼发布,距今已逾一年。尽管科技巨头如谷歌、Meta,以及硅谷新贵如Mistral AI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一般横扫科技圈的力量——直到GPT-4o的诞生。

当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。当日,OpenAI首席执行官阿尔特曼发推文表示,新的GPT-4o是OpenAI“有史以来最好的模型”。

据悉,GPT-4o支持文字、图像、语音和视频输入和输出,OpenAI承诺未来将免费让普通用户使用,同时将开放API给GPT开发者,价格直接便宜50%。目前,该模型仅开放了文本和图像功能。

本周,《每日经济新闻》记者从图像和文本两大层面深度体验了GPT-4o的效果,着重识图能力的测试。综合来看,GPT-4o在反应速度上有极大的提升,识图方面冠绝群雄,不仅能够准确识别图片,还能以类人的思维理解图像内容。而在长文本总结方面,与当前模型的差距并不突出。

GPT-4o到底是如何“炼”成的?当地时间5月15日,OpenAI联合创始人之一John Schulman在接受科技播客主持人Dwarkesh Patel采访时透露,后训练是提高模型性能的关键因素。

GPT-4o的识图能力有多牛?四大维度深度体验

基于图片类型,记者将识图功能的测评分为4大维度,分别为普通图像、特定专业领域的图像、数据图像和手写图像。

一、普通图像识别

(1)内容较为单一的图像

记者首先选取了一张波士顿动力机器人跨越障碍物的图像,内容较为简单,图上无文字,随后要求大模型仔细识图并描述内容。GPT-4o非常出色地完成了任务,细节描述无可匹敌,准确无误地识别了机器人的运动状态、地面障碍等丰富细节。


图片来源:GPT-4o

(2)内容较为复杂的漫画

接着,记者选取了由多个图像组成、内容较为复杂的漫画。GPT-4o可以完整地总结出每一格漫画的内容,并以准确的顺序进行讲述。更令人吃惊的是,GPT-4o完全以类人的思维解构了漫画的逻辑,它能够理解这是一种“拟人和夸张的手法”,并准确理解了漫画的幽默感。


图片来源:GPT-4o

二、特定专业领域的图像

(1)医学领域

记者准备了一张mRNA疫苗工作原理图,图像并未直接说明这是一张疫苗工作原理图,但图上写有相应文字,例如“刺突蛋白”、“蛋白质翻译”和“脂质纳米颗粒”等术语。

GPT-4o的表现惊艳,不仅准确识别了该图的主旨内容,并依据图示上的过程用通俗的语言解释了mRNA疫苗的工作原理。


图片来源:GPT-4o

(2)房地产领域

接着,记者选取了一张建筑面积134平方米的户型图,让大模型识图并总结户型优劣势。GPT-4o呈现了总体令人较为满意的结果,该模型不仅能识别户型基本情况,分辨出“半赠送”的建筑面,也能够清楚地总结户型的优劣势,但在数据准确性上有待提高。





图片来源:GPT-4o

三、数据图像的分析和转换

在此维度下,记者选取了一张折柱混合数据图。GPT-4o能够准确地识别数据图上的信息,并按要求以图表的形式重新呈现,准确率高达100%。


图片来源:GPT-4o

四、手写指令和逻辑推理

最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确识别了手写体文字并遵照指示,且答题逻辑完全合理,也最终给出了正确答案。



图片来源:GPT-4o

除了识图功能之外,记者也从文本层面对GPT-4o的长文本总结功能进行了测评。记者选取了一篇近万字的调查稿件,让其总结要点。GPT-4o不负众望地完成了任务。



图片来源:GPT-4o

GPT-4o是如何“炼”成的?后训练功不可没

从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。

那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以从OpenAI联合创始人John Schulman当地时间5月15日与科技播客主持人Dwarkesh Patel的对话中一窥究竟。

John Schulman在采访中提到,后训练(Post-Training)是提高模型性能的有效方法,通过额外的训练和微调可以显著提高模型的能力。

在这里需要区分两个关键的概念,在大模型训练中通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上进行(通常是让模仿互联网上的内容),目标是通过在较大的任务上训练模型,使得模型学习到通用的特征。

而后训练指的是专注针对特定行为优化模型,在预训练模型的基础上,使用额外的大规模未标注语料库继续训练模型参数,这个过程可以进一步丰富模型对语言的理解和生成能力,使其获得更广泛的知识。

根据John Schulman的说法,后训练是GPT-4模型不断升级的关键因素。据悉,当前 GPT-4 的 Elo分数(编者注:一种大模型基准评级标准)比最初发布的版本高出了大约 100 分,而这种改进大部分都是由后训练带来的。

他同时暗示,在未来用于训练的算力中,OpenAI可能将偏向后训练。他说道:“模型生成的输出质量比网上的大多数内容都要高。因此,让模型自己思考似乎更有道理,而不仅仅是训练来模仿网络上的内容。所以,我认为从第一性原理上来说,这是有说服力的。我们通过后训练取得了很多进步。我希望我们会继续推动这种方法,并且可能会增加投入到后训练中的计算力。”

针对GPT-4o强大的多模态能力,英伟达高级研究科学家Jim Fan发表长文表示,从技术角度来看,这需要对标记化和架构进行一些新的研究,但总体上是一个数据和系统优化问题。

在Jim Fan看来,GPT-4o很可能是GPT-5的一个早期训练点,但训练尚未完成。从商业角度上,他认为,“GPT-4o的定位透露出OpenAI某种不安全感,在谷歌开发者大会之前(发布GPT-4o),(意味着)OpenAI宁愿超越我们对GPT-4.5的心理预期,也不愿因为达不到对GPT-5的极高期望而令人失望。这是一个聪明的举措,可以争取更多时间。”目前,业界广传GPT-5将在年底发布。

Jim Fan的观点与一些业内分析不谋而合。分析认为,OpenAI选择此时发布GPT-4o,是为了在竞争对手尤其是谷歌不断发起挑战的情况下,继续保持领先地位。


“宫斗”半年后,OpenAI“保卫人类”的团队“分崩离析”,年初至今公司已有9人离职


图片来源:每经记者 刘雪梅

在“宫斗”半年后,OpenAI“保卫人类”的团队分崩离析。不仅首席科学家伊利亚·苏茨克沃(Ilya Sutskever)和他的亲信詹·莱克(Jan Leike)在本周双双离职,他们共同领导的“超级智能对齐团队(AI风险团队)”也在周五被证实解散。

美东时间5月14日(周二),OpenAI宣布其首席科学家兼联合创始人伊利亚·苏茨克沃将离职,他的职位将由研究总监雅各布·帕乔奇(Jakub Pachocki)取代。

在去年11月OpenAI的“宫斗”风波结束后,苏茨克沃就鲜有露面,公司董事会调整后也未有关于其职务的消息。在OpenAI最新发布的GPT-4o主页上,苏茨克沃的名字出现在了“其他领导者”栏。


图片来源:OpenAI官网截图

苏茨克沃也在X平台上发推宣布了辞职决定,并附上一张照片,画面中,他和继任者帕可斯基、联合创始人雷格·布洛克曼、首席执行官阿尔特曼,以及首席技术官米拉·穆拉蒂一字排开,成为这段历史时刻的纪念。


苏茨克沃(中)发布的与OpenAI高管的合照 图片来源:X

至于接下来的安排,苏茨克沃在其X推文中称他会开发一个全新有意义的项目,适当的时候就会披露更多细节。有人猜测,他可能会加入马斯克的xAI,虽然有戏剧性,但也不排除可能性。另有不少人猜测,其新项目还是与ChatGPT等生成式AI产品有关,而且可能是一个开源项目,毕竟他是这个领域宗师级人物。

苏茨克沃1985年出生于苏联,成长于以色列,会俄语、希伯来语和英语。在多伦多大学求学期间,他师从“现代人工智能之父”杰弗里·辛顿,并与其合作开发了AlexNet,该神经网络的诞生极大地推动了深度学习技术在图像识别领域的应用。

2015年,在马斯克力邀之下,苏茨克沃加入OpenAI,成为初创团队的一员,在ChatGPT语言模型和Dall-E图像生成器的研发过程中扮演了关键角色。《纽约时报》报道称,苏茨克沃加入OpenAI后参与了涉及神经网络的人工智能突破,这项技术在过去十年中推动了该领域的显著进步。2023年,苏茨克沃入选2023年度十大科学人物榜单(Nature's 10),被Nature评价为“ChatGPT和其他改变社会的人工智能系统的先驱”。

不过,在去年10月份罕见接受《麻省理工科技评论》的专访时,苏茨克沃曾表示,他不打算构建下一个 GPT 或图像生成模型 DALL-E,而是打算弄清楚如何阻止超级人工智能变得不受控制。作为未来主义的信徒,他认为这种仍处于假设的未来技术终会出现。

苏茨克沃宣布离职后几个小时,Ily的亲信、OpenAI超级对齐团队负责人之一詹·莱克(Jan Leike)也在X平台上发文宣布辞职。此外,本周五,OpenAI证实,由苏茨克沃和莱克共同领导的“超级智能对齐团队”已经解散。此后,该团队的研究工作将被整合到OpenAI的其他研究小组中。


图片来源:X

2023年9月,莱克被《时代》杂志评为人工智能领域100位最具影响力人物之一。莱克周五在X上公开透露了他离职的部分原因。他与OpenAI高层在公司的核心优先事项上存在长期分歧。团队在推动其研究项目和争取计算资源时遇到了重大阻碍。构建超人智能机器本身就是一项危险的事情,OpenAI肩负全人类的重任。但在过去几年里,安全文化和流程都让位于产品。

马斯克针对OpenAI超级对齐团队已经解散这一消息评价称:“这显示安全并不是OpenAI的首要任务。”

苏茨克沃和莱克的先后离职只是OpenAI团队近期动荡的一部分。《每日经济新闻》记者根据OpenAI的公开声明和媒体报道梳理发现,今年以来,OpenAI已有9名高管和员工离职。

据The Information报道,OpenAI人力部副总裁戴安·尹(Diane Yoon)和非营利和战略计划负责人克里斯·克拉克(Chris Clark)几周前辞职。同在4月,研究人员Leopold Aschenbrenner和Pavel Izmailov也已经离开OpenAI,他们此前都曾在超级对齐团队工作过。2月,OpenAI创始成员之一、公司AI 技术研究员安德烈·卡帕蒂(Andrej Karpathy)也宣布离职,以专注于个人项目。


图片来源:每经制图


泽连斯基签署罪犯动员法案


图片来源:央视新闻截图

据央视新闻,乌克兰媒体当地时间5月17日报道称,乌克兰总统泽连斯基当天签署了罪犯动员法案。

当地时间5月8日,乌克兰最高拉达(议会)以279票赞成通过了罪犯动员法案。报道称,该法案将对直接参与保卫国家独立和领土完整的服刑人员实行有条件提前释放。那些因轻罪入狱的囚犯将可在乌武装部队服役,但犯有谋杀、强奸、性暴力或危害国家安全罪的人将不会被动员。

俄罗斯国防部当地时间16日通报称,过去一天,俄军摧毁乌军坦克、装甲车、美制M777榴弹炮、无人艇仓库等乌军装备和设施。俄防空部队击落乌军3架米格-29战机,击毁乌军25架无人机和多枚战术导弹、反辐射导弹、制导炸弹和各类型火箭弹。

苹果据称2025年将推出一款更薄的iPhone


图片来源:每日经济新闻 资料图

当地时间5月17日,据外媒The Information援引三名知情人士,苹果公司正在开发一款更轻薄的iPhone手机,预计将于2025年推出。

报道称,这款更薄版本的iPhone目前在苹果公司内部被称为iPhone 17 Slim,代号为D23定价可能比苹果iPhone Pro Max更高。Pro Max目前已经是苹果定价最贵的机型,起售价在1200美元。

消息人士预计,该款新机型将于2025年9月与iPhone 17系列一起推出。了解苹果开发流程的内部人士暗示,iPhone Plus型号可能会被淘汰,为iPhone 17 Slim让路。此外,苹果可能还计划在2025年春季推出一款更便宜的iPhone,作为iPhone SE的后续产品。

苹果正在努力应对 iPhone 销量下滑的问题,截至3月份的最近一个季度,iPhone 销量与去年同期相比下降了11%。更薄 iPhone 可能会重新激发人们对该产品的兴趣。

马斯克宣布脑机试验开始招募第二名患者


图片来源:X

当地时间周五,脑机接口公司Neuralink的创始人埃隆·马斯克宣布,继年初首个参与该公司脑机设备植入实验的患者手术成功100天后,正式开始招募第二个接受脑机植入的患者。

Neuralink开发的N1 Implant需要通过手术放置在使用者头骨中,使植入者光凭“意念”就能操作电脑、手机。目前这类设备主要应用在瘫痪患者身上,马斯克也曾表示,希望将适应症扩展至听力、视力受损人群,并最终帮助“人类与人工智能结合”。

首试者诺兰·阿博(Noland Arbaugh)表示,他现在每天要使用这款植入物10-12个小时,只有在设备充电或者他睡觉时才会让它休息。

根据诺兰与Neuralink的协议,他会在植入设备后1年内向公司提供数据,之后他们会讨论下一步是否要停用或者移除设备。

但诺兰表示,他更想要保留这个设备,并在下一代产品准备好时升级脑子里的接口。诺兰表示:“我打赌下一个得到这东西的人会和我有一样的感觉,一旦你尝试使用它,就停不下来了。这款设备真是让我震惊。”

外资抄底中国资产,《大空头》原型继续看涨中概股

当地时间周三,在美国证监会网站刊登的13F报告显示,华尔街知名基金经理、《大空头》原型迈克尔•巴里(Michael Burry)在今年第一季度继续加倍押注京东和阿里等中概股。

报告显示,截至3月31日,巴里增持了16万股京东股票和5万股阿里股票,使得这两只股票继续成为其前两大持仓,分别占其股票投资组合的约9.53%和8.74%。

今年初以来,随着国内经济复苏、政策刺激以及众多中概股估值降至低位,不少海外投资者对于中概股的兴趣也在持续增加。

国家外汇管理局披露的最新数据显示,4月境外投资者净买入境内债券、股票分别为1247亿元和451亿元人民币。

安进小细胞肺癌治疗药获FDA批准:能缩小肿瘤 延长寿命


图片来源:安进官网

周四(5月17日),美国食品和药物管理局(FDA)批准了安进公司(Amgen)用于治疗肺癌的疗法。

Tarlatamab是安进研发的一种双特异性T细胞接合剂(BiTE)抗体,靶向DLL3和CD3,作为广泛期小细胞肺癌(ES-SCLC)患者的二线治疗或后期治疗。该药物将以Imdelltra的名称被推出。

在临床试验中,该药物已被证明可以缩小肿瘤,并帮助小细胞肺癌患者显著延长寿命。




免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。

记者:文巧 蔡鼎 谭玉涵

编辑:兰素英 孙宇婷

视觉:刘青彦

排版:谭玉涵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
鲁能大牌新归化夏窗正式到位,将锁定主力指挥官位置,本人已同意

鲁能大牌新归化夏窗正式到位,将锁定主力指挥官位置,本人已同意

罗掌柜体育
2024-06-15 19:35:29
为什么北京上海二千多万人口却只有五万多考生,河南却一百多万?

为什么北京上海二千多万人口却只有五万多考生,河南却一百多万?

一口娱乐
2024-06-16 17:36:20
电影之夜红毯生图来了!章子怡浓妆翻车,娜扎太瘦皮肤状态差

电影之夜红毯生图来了!章子怡浓妆翻车,娜扎太瘦皮肤状态差

萌神木木
2024-06-16 18:50:44
A股这27家企业跌到历史底部了还要减持3%,就是一个局,赶紧远离

A股这27家企业跌到历史底部了还要减持3%,就是一个局,赶紧远离

股海风云大作手
2024-06-16 17:36:07
特朗普放弃抵抗,美大选提前终结?奥斯汀罕见对华交底,果不简单

特朗普放弃抵抗,美大选提前终结?奥斯汀罕见对华交底,果不简单

全民历史观
2024-06-16 09:19:07
阿南德最新预言!2024年,美国动乱,日本地震,中国将有大事发生

阿南德最新预言!2024年,美国动乱,日本地震,中国将有大事发生

飞云如水
2024-06-10 22:25:48
臭名在外,人人喊打!

臭名在外,人人喊打!

凡事一定有办法13119
2024-06-15 14:56:00
五名新援花费2.38亿英镑?埃杜为阿尔特塔组建超级阵容

五名新援花费2.38亿英镑?埃杜为阿尔特塔组建超级阵容

足球推文C
2024-06-16 11:22:34
中老年男人,夏天少穿这4种“假时髦、真土气”衣服,显老又油腻

中老年男人,夏天少穿这4种“假时髦、真土气”衣服,显老又油腻

潮人志Fashion
2024-06-16 18:27:11
肖赧:中国足球出不了亚马尔,现在真的是专业人做专业事么

肖赧:中国足球出不了亚马尔,现在真的是专业人做专业事么

懂球帝
2024-06-16 11:33:06
真没必要让武磊再上,海港居然能客场3-0拿下天津,不可思议

真没必要让武磊再上,海港居然能客场3-0拿下天津,不可思议

百里无心
2024-06-16 10:45:53
基因无法骗人!看《爸去哪儿》7位萌娃,10年后颜值差距一目了然

基因无法骗人!看《爸去哪儿》7位萌娃,10年后颜值差距一目了然

贾文彬的史书
2024-06-15 20:34:59
两性羞羞:女生长期不啪啪,到底会怎么样?

两性羞羞:女生长期不啪啪,到底会怎么样?

喜马拉雅主播暮霭
2024-06-16 11:32:30
工资到账:小米汽车员工实发工资曝光 年入百万不是梦

工资到账:小米汽车员工实发工资曝光 年入百万不是梦

快科技
2024-06-15 19:33:07
12秒80!吴艳妮逆天一战,在日本2连冠,再创年度亚洲最佳成绩

12秒80!吴艳妮逆天一战,在日本2连冠,再创年度亚洲最佳成绩

黑色柳丁
2024-05-19 15:09:30
以美元击败美元,中国的一招反制让美国吃瘪了!

以美元击败美元,中国的一招反制让美国吃瘪了!

杂谈天下式
2024-06-16 12:13:33
属兔人:6月17号要乐开花了,你知道6月17号是什么日子吗?

属兔人:6月17号要乐开花了,你知道6月17号是什么日子吗?

牛锅巴小钒
2024-06-16 16:49:22
31岁!英超最年轻少帅正式上任:2年前刚退役!2年后卖给切尔西?

31岁!英超最年轻少帅正式上任:2年前刚退役!2年后卖给切尔西?

风过乡
2024-06-16 09:12:31
可惜了!中国石油2年股价5元拉11元,股东涌出11万人,倒在黎明前

可惜了!中国石油2年股价5元拉11元,股东涌出11万人,倒在黎明前

惜别的海岸
2024-06-16 13:30:21
《歌手》第六期收视率排名公布 ,那英垫底,孙楠第三,黑马夺冠

《歌手》第六期收视率排名公布 ,那英垫底,孙楠第三,黑马夺冠

岚仔小弟
2024-06-15 23:25:22
2024-06-16 22:02:44
每日经济新闻
每日经济新闻
中国主流财经全媒体平台。
936424文章数 2698358关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

游戏
数码
本地
时尚
公开课

《夺宝奇兵》涉及多个关卡场景 新老角色都有

数码要闻

AMD RDNA3.5核显跑分喜人!非常接近RTX 2050

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

伊姐周日热推:电影《沙漏》;动漫《眷思量2》......

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版