网易首页 > 网易号 > 正文 申请入驻

上手了刷屏一天的GPT-4o,我感觉目前也就那样

0
分享至



没有所谓的 AI 搜索引擎,也没有炸裂的 GPT-5 ,但 OpenAI 还是让大伙儿感受到了,什么叫做 “Only OpenAI Can Do” 。

就在今天凌晨, OpenAI 的春季发布会终于是来了。



他们也没多讲几句废话,整场发布会就二十来分钟,其中,最重磅的无异于GPT-4o 新模型的发布。

关于 GPT-4o 起名的缘由, OpenAI 官方是这么解释的: “ o “ 的全称是 “ omni ” ,也就是 “ 全能 ” 的意思。

之所以说它全能,是因为它能把文本、视觉、音频全打通了。换句话说,你跟 GPT-4o 对话就跟真人似的。

最重要的是, GPT-4o 是免费向用户开放的,不开 Plus 会员也能用,只不过 Plus 会员要多一些使用次数。

反正跟世超一起蹲守直播的同事们看了,都直呼想要。。。



就连奥特曼也在推特上毫不避讳地,把 GPT-4o 跟科幻电影《 Her 》联系起来。( 这部电影讲的是人和 AI 语音助理谈恋爱的故事 )



评论区的网友们也纷纷表示 “ 见证历史 ” “ 电影终于要照进现实了 ” ,甚至还用奥特曼的照片,整出来了个 “ him ” 。



玩笑归玩笑,但世超觉得, OpenAI 这次 GPT-4o 的现场演示效果,特别是实时语音和视频交互的能力,确实甩了其他现役大模型好几个车尾灯

不过光这么说,大伙儿对 GPT-4o 的感受可能也不深,咱直接来看演示。

像演示人员让 GPT-4o 从一数到十,中途就嫌它语速太慢了,让它说快点儿, GPT-4o 能立马反应过来,后续随时插话它都能瞬间 get 到。

就这一个接一个的连续对话实力,说实话世超还没在 AI 身上体验过。

给 GPT-4o 一个麦克风和摄像头权限,它能分分钟化身成面试指导官,比方视频里的这个老哥,说自己要去 OpenAI 面试,让 GPT-4o 给点着装建议。

它迅速 “ 打量 ” 了下这位老哥,礼貌不失幽默地给出了 “ 抓个头发 ” 的中肯建议。但老哥打算走个不听劝的人设,顺手拿出个帽子,问能不能戴它去面试。

GPT-4o 这边反应贼快,识破了老哥明知故问地恶作剧,顺着他的话茬说,也不是不行,最起码能让你在人群中脱颖而出。

如果不给世超看演示画面,光听声音我可能会以为,这就是两个朋友之间在开玩笑。

当然,以 GPT-4o 的知识储备和多模态能力,它也有相当正儿八经的应用场景

一扭头,就能直接化身成视障人士的眼睛,帮他们识别所在的位置,要是想知道眼前都有啥场景, GPT-4o 也能够绘声绘色地描绘出来,甚至还能一步一步指导视障人士打车。

再摇身一变, GPT-4o 还能化身成数学老师,把屏幕的权限开放给它,它能一步步指导你做题,你在题目上写了啥画了啥 GPT-4o 也都能看得一清二楚。

有一说一,这跟世超上中学时爸妈请的家教没啥两样。。。

看完官方的案例视频,相信大伙儿跟世超一样,已经被震撼得没边儿了。

而为了做到这些, OpenAI 在底层的模型上可是下了不少苦功。

之前咱们用 ChatGPT 的语音对话,都是一轮一轮的来。它得先把咱说的话转换成文字输给 GPT-4 ,等 GPT-4 生成文字答案之后,才能再转成语音输出。

也就是说,以前和 ChatGPT 语音对个话,它得动用三个模型,一个管音频转文本,一个 GPT-4 管文本转文本,另外还有一个管文本转音频。

一整套流程下来,耐心都快给磨没了,而且中间除非咱们手动暂停,否则根本没插话的机会。



但 GPT-4o 不一样,它是一个原生的多模态模型,无论文字音频,还是视频啥的,所有的输入和输出都在同一个神经网络里处理

这种打娘胎里自带多模态的特性,让 GPT-4o 能够听懂好赖话,表达自己的情绪,和它对话也能像吃了德芙一样丝滑。

不过,上面那些视频终归还是 “PPT” ,没到手实测一波,世超也不敢轻易下定论这玩意儿是不是真的有这么强。毕竟前段时间, Sora 生成的《 气球人 》短片才被传出加了大量的人类后期。

而在实际用这块, OpenAI 还是一如既往的狗,嘴上说 GPT-4o 都能免费用,但也要分先来后到,而且功能也慢慢开放

现在能用上 GPT-4o 的只有 Plus 账号,而且最重磅的实时视频和语音功能,毛都看不着。



但有总归比没有强,世超手边恰好也有个 Plus 账号,而且官方也说了,GPT-4o 生成的速度还会比 GPT-4 快上两倍

所以咱这波,就先提前给差友们试试 GPT-4o 的实力。

先让它给咱讲一个童话故事,顺便再画出整个故事的分镜图。GPT-4o 没犹豫几秒,库吃库吃就开始写了。



写完中间也没带停顿,直接开始画分镜了。



而同样的问题再抛给 GPT-4 ,它一开始就得磨蹭半天在问题上。。。



讲清楚要求后才肯继续写,而且写完之后也不继续画分镜图,还得等世超我再亲自强调一波。





不过虽然 GPT-4 比 GPT-4o 墨迹了不少,但从内容来看,我还是会觉得GPT-4 会更丰富一点

再借我司老员工火锅的照片一用,分别让 GPT-4 和 GPT-4o 生成一张像素风的图片。



在生成速度上 GPT-4o 完胜,但要抠细节的话两个就半斤八两了。

GPT-4 识别出了火锅嘴里叼着的是袋子, GPT-4o 多识别出了一只拖鞋,非要比的话,其实 GPT-4 的金毛更像火锅一些。。。

( 左边 GPT-4 ,右边 GPT-4o )



接着,我又让 GPT-4o 把咱差评的 LOGO 换成 3D 图片,结果它整出来字,翻遍整本新华字典,估计都找不到。



但不识汉字也是历代 ChatGPT 的老毛病了,换成英文再要求它,你别说,这次出来的整体效果还可以,就是经不起细看,不少英文拼写都是错的。。



整个上手试下来, GPT-4o 给我最大的印象就是快,非常快

但说实话,除了快,世超真没觉得有啥特别的了,与其说 GPT-4o 是 GPT-4 的智商进化版,倒不如说是把 GPT-4 的交互能力单拎出来强化了一波。

就像奥特曼在博客里提到的, “ 达到人类响应时间和表达水平 ” 是 AI 的巨大变化。大模型的终极形态,也应该是让人和 AI 的交流回归到最原始、最简单的形态。

在未来,咱们面对一台电脑、一部手机,直接说话交流,就是最主要的交互方式。



不过这次 GPT-4o 最厉害的杀手锏:视频交流功能,还没放出来,等到时候咱能体验到了再下结论也不迟。

另外,网友们也没干坐着,也在各种研究 GPT-4o 的,结果,却扒出了一些番外的料。。。

也不知道 GPT-4o 的中文语料库是哪儿来的,里面有不少的钓鱼网站的违禁词,像什么 “ 日本 x 片免费视频 ” 这类的。



给人老外都整无语了。。



像这样的乐子,以后指不定还要冒出来不少。但言归正传, GPT-4o 的出现确实又给 AI 开了个新副本

按照之前 ChatGPT 问世之后,其他友商步步紧逼的尿性。世超盲猜,在 GPT-4o 之后,类似的 “Claude-o”“Gemini-o” 应该很快就会出现。

刚好明天就是谷歌的 I/O 了,咱们也浅浅期待一手好吧。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
时隔18个月,中美防长面对面聊得怎样?

时隔18个月,中美防长面对面聊得怎样?

直新闻
2024-05-31 23:15:22
说实话,我确实不大理解,今天看到相关新闻时很震惊。

说实话,我确实不大理解,今天看到相关新闻时很震惊。

火山杂谈
2024-05-31 23:29:47
重磅!芬兰爆发大游行,要求政府出兵收复被俄罗斯侵占的领土

重磅!芬兰爆发大游行,要求政府出兵收复被俄罗斯侵占的领土

霹雳炮
2024-05-31 21:31:54
Here we go!罗马诺:穆里尼奥将担任费内巴切主帅并签约两年

Here we go!罗马诺:穆里尼奥将担任费内巴切主帅并签约两年

懂球帝
2024-05-31 22:39:11
美媒炒作中国076两栖攻击舰

美媒炒作中国076两栖攻击舰

观察者网
2024-05-31 18:18:17
中国女排为何1-3溃败?前队长惠若琪一针见血,点名1人,球迷怒批

中国女排为何1-3溃败?前队长惠若琪一针见血,点名1人,球迷怒批

二哥聊球
2024-06-01 00:24:44
就业率98.1%!日本应届生迎来就业“反选时代”,日企“抢人大战”:上班就送100万日元,一年有129天休假【附大学生就业现状分析】

就业率98.1%!日本应届生迎来就业“反选时代”,日企“抢人大战”:上班就送100万日元,一年有129天休假【附大学生就业现状分析】

前瞻网
2024-05-31 19:50:16
5月31日俄乌最新:美国政策出现重大逆转+普京官邸被点

5月31日俄乌最新:美国政策出现重大逆转+普京官邸被点

西楼饮月
2024-05-31 15:00:13
28.98万起,问界新M7 Ultra版发布!余承东称华为智驾有信心干翻特斯拉FSD,还首次回应山西车祸事件

28.98万起,问界新M7 Ultra版发布!余承东称华为智驾有信心干翻特斯拉FSD,还首次回应山西车祸事件

每日经济新闻
2024-05-31 22:49:06
管姚:中美防长“香会”见面,这两个关键细节最值得说

管姚:中美防长“香会”见面,这两个关键细节最值得说

直新闻
2024-05-31 23:22:41
央视三胎宣传片,网友:这可能是现在人不想生孩子的原因!

央视三胎宣传片,网友:这可能是现在人不想生孩子的原因!

史说新风
2024-05-31 09:23:42
谈到台海,俄高层的说法变了,美国或该考虑:1打2,扛得住吗?

谈到台海,俄高层的说法变了,美国或该考虑:1打2,扛得住吗?

千里持剑
2024-05-31 15:17:18
网易号平台每日辟谣公告(五月三十一日第一则)

网易号平台每日辟谣公告(五月三十一日第一则)

网易号官方平台
2024-05-31 12:15:02
【奔流·调查】怀胎7月女大学生被当肾病医治后身亡 河南邓州市人民医院拒绝提供鉴定材料

【奔流·调查】怀胎7月女大学生被当肾病医治后身亡 河南邓州市人民医院拒绝提供鉴定材料

奔流新闻
2024-05-31 17:06:25
伊朗60多名前外交官集体发声,要求与中俄保持距离,不要敌视西方

伊朗60多名前外交官集体发声,要求与中俄保持距离,不要敌视西方

最爱小米辣呀
2024-05-31 13:49:46
61岁穆帅赴土超内幕:遭豪门集体无视,年薪2000万镑,将其做跳板

61岁穆帅赴土超内幕:遭豪门集体无视,年薪2000万镑,将其做跳板

风过乡
2024-05-31 22:59:09
怒扇小孩耳光后续:13000和解,关系曝光,网友怒了,商家被关门

怒扇小孩耳光后续:13000和解,关系曝光,网友怒了,商家被关门

鬼谷子思维
2024-05-31 15:56:45
严查!拿着4万退休金住豪宅,却劝月入4000的人努力?其心可诛

严查!拿着4万退休金住豪宅,却劝月入4000的人努力?其心可诛

一口娱乐
2024-05-31 15:31:47
GQ盛典这一夜,明星病态审美暴露无遗,娜扎瘦到皮包骨毫无美感

GQ盛典这一夜,明星病态审美暴露无遗,娜扎瘦到皮包骨毫无美感

萌神木木
2024-05-31 20:35:26
四十岁大叔坐火车,用手机向窗外拍照,被其他乘客怀疑是间谍

四十岁大叔坐火车,用手机向窗外拍照,被其他乘客怀疑是间谍

西游日记
2024-05-31 19:58:44
2024-06-01 08:56:49
差评
差评
这些东西,大佬们肯定不想让你
7249文章数 487228关注度
往期回顾 全部

科技要闻

华为上新!余承东:问界6月销量将超4万辆

头条要闻

媒体:中美防长见面后 美方第一时间发新闻稿积极评价

头条要闻

媒体:中美防长见面后 美方第一时间发新闻稿积极评价

体育要闻

欧文:当老二怎么了?硬就行了!

娱乐要闻

白玉兰提名:胡歌、范伟争视帝

财经要闻

证监会:对恒大地产罚款41.75亿

汽车要闻

外观内饰升级/六项权益 全新哈弗H6开启预售

态度原创

亲子
数码
游戏
公开课
军事航空

亲子要闻

她居然还是跳的最好的一个

数码要闻

真正的咸鱼翻身!两年前的骁龙6 Gen 1怎么就翻红了

《合金装备Δ 食蛇者》或被延期至2025年 十天内游戏消息

公开课

近视只是视力差?小心并发症

军事要闻

拜登称以色列提出新的三阶段停火方案

无障碍浏览 进入关怀版