网易首页 > 网易号 > 正文 申请入驻

OpenAI发布全新AI模型GPT-4o,微软却称自己才是AI“灭霸”

0
分享至

近日,人工智能领域的领军企业OpenAI发布了全新的AI模型GPT-4o,这一重大突破被誉为“一夜改变人机交互历史”。GPT-4o不仅支持语音聊天,还能进行实时视频交互,其丝滑程度堪比真人交互。这一技术的问世,无疑将为人工智能领域带来新的发展机遇。

OpenAI的野心

OpenAI的旗舰产品ChatGPT虽然能理解自然语言并回答用户的问题,但由于其“预训练”的原理,无法即时搜索内容。此外,大语言模型的生成机制也使得ChatGPT无法完全规避“一本正经地胡说八道”的现象。因此,人们想要了解最新的实时内容,仍然需要求助于搜索引擎。

传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范围,并匹配可能符合用户意图的海量信息。然而,传统搜索的痛点在于不同来源的海量信息带来的大量冗余和信息不一致,这也导致搜出来的信息一大堆,但找不到有用的东西。

OpenAI显然希望成为人类和数据的重要连接点,仅靠ChatGPT(哪怕是再聪明的GPT)也只能满足一部分需求,推出搜索引擎势在必行。目前,业内最为关注的是OpenAI的搜索引擎将会是一个什么样的形态,以及它是否真能撼动Google一家独大固化已久的搜索市场生态。

在OpenAI之前,美国已经有一款生成式搜索引擎Perplexity。成立于2022年的Perplexity是一家位于美国硅谷的创业公司,该公司专注于利用人工智能技术开发生成式搜索引擎,为搜索查询提供直接答案,而不是提供网站链接列表。PerplexityAI会在提供的答案中整合视频、图像等,有时还会直接提供链接资源。Perplexity受到包括英伟达CEO黄仁勋等人的喜欢,成立一年半MAU达到1000万。

那么,OpenAI的搜索引擎会与PerplexityAI类似,还是会带来更多惊喜?我们还需要等待OpenAI的最终揭晓。

GPT-4o不仅是完全免费的,而且覆盖了桌面与移动App,性能大幅提升,可以综合处理文本、图片和音频,人机交互更加自然简单。例如,可以让GPT-4o加入网络会议,为用户记录发言总结概要。

GPT-4o具体有什么用?用户可以让GPT-4o处理眼前的问题,极大提升生产力,可以与AI实时语音对话,就像是与真人聊天一样自然流畅。AI处理反应已经达到人类的速度,甚至还可以理解用户的情绪,以相应的情感作出回应。

抢微软的风头

面对OpenAI的故意撞车和抢占风头,谷歌在今天的I/O大会上又拿出了怎样的AI产品,是否带来了足够的震撼与新意?

谷歌I/O开发者大会今年已经进入了第16个年头,AI早已成为I/O大会的绝对乃至唯一的主角。谷歌CEO皮查伊更是在结束时宣布,整场发布会一共说了121次AI,引发了全场大笑。虽然整场发布会都没有提及竞争对手,但谷歌CEO皮查伊从主题演讲一开始就开始秀谷歌的AI实力,宣布谷歌已经全面进入Gemini时代。他强调谷歌已经在AI领域投入了十多年时间,贯穿了AI的每一层:研究、产品、基础设施。

虽然AI新贵OpenAI在产品发布方面抢占了先发优势,但谷歌在研究论文、用户规模、产品数量以及算力方面都占据着压倒性优势,这也是OpenAI必须与微软结盟的直接原因,因为两家公司都不可能单独与谷歌抗衡。

皮查伊还宣布,Gemini大模型已经覆盖了谷歌全平台的20亿用户产品,仅仅三个月时间就有100多万用户注册使用。而两个月前发布的原生多模型Gemini 1.5 Pro已经得到超过150万开发者的使用。

在性能方面,谷歌就是AI业界的灭霸。Gemini 1.5 Pro此前直接将Token(上下文处理)性能提升到了百万级别,全面压倒了受困于性能变慢的GPT-4.0 Turbo。三个月后,谷歌在今天宣布改进版的Gemini 1.5 Pro全面开放给Gemini Advanced的用户,并且支持35种语言。

更为残暴的是,谷歌还将Gemini 1.5 Pro的上下文窗口处理性能直接翻倍到了200万(暂时只面向开发者提供),在这方面OpenAI只能望尘莫及。皮查伊宣布,这是朝着无限上下文的最终目标迈出的重要一步。

Gemini 1.5 Pro可以给用户带来怎样的实际体验?谷歌用Workspace办公组件展示了AI给生产力带来的巨大变化。举例来说,如果是通过Google Meets进行远程会议,哪怕用户无法参会,也可以让Gemini为自己录音并列出会议纪要。

有了Gemini,Gmail邮箱就有了灵魂。代写邮件已经是基本操作了。用户可以让Gemini帮助自己整理和总结Gmail的海量邮件,根据最近的收据和信用卡账单邮件整理归纳出用户的消费支出,给出一份专业又具体的财务支出清单。

给AI装上眼睛嘴巴

周鸿祎指出,据OpenAI发布会上简短的技术原理介绍,区别于传统将把语音先翻译成文字处理后再翻译成语音的做法,这次的技术是直接把语音进行了处理,形成了一个整合的大模型引擎,实现对语音输入的直接理解——包括把语音中饱含的情绪、感情、语调、口音这些细节都进行了理解,同时是直接输出语音。

“这就带来了一个全新的体验,就是时延大概只有300毫秒左右,达到了人类和人类谈话的响应速度,这样不仅能听得懂你话里的情绪,在输出回答的时候也可以伴随着高兴、悲伤、失望、兴奋或者是更复杂的感情。”周鸿祎表示。

周鸿祎还指出,除了语音处理层面带来的惊艳之外,有一个容易被忽视的地方是,实际上GPT-4o的还可以直接打开手机摄像头,直接通过手机摄像头赋予它更强大的眼着的能力。这个可能还比不上Sora,但是它比GPT-4.5的版本可以输入图片输入表格的能力又提升了一步。“所以总结来讲就是,GPT-4.0相当于给人工智能赋予了对知识理解的能力,相当于有了一个大脑,然后GPT-4.5相当于给了一些初级的看见的能力,而GPT-4o实际上是给它增加了真正能看懂这个世界的眼睛,和能听明白人说话的耳朵,而且嘴巴还能够自由自在地表达自己情绪和情感的能力。”。

在周鸿祎看来,有些人会对此次发布OpeanAI没有推出GPT-5.0觉得比较失望,但是通向通用人工智能不仅是要在超级的推理能力、知识能力、逻辑能力上要赶超人类,更重要的能力还包括跟人交互的能力。所以,当AI能通过无论是手机摄像头还是无处不在的物联网摄像头更看明白这个世界,而且能以跟人一样的响应速度进行交互的时候,这件事就变得非常可怕了,“也就是它就让人工智能真正的更像人了”。

总结来说,人工智能技术的发展日新月异,每一次技术的突破都为我们带来了新的惊喜。OpenAI发布的全新AI模型GPT-4o以及谷歌在I/O大会上展示的Gemini 1.5 Pro都是人工智能领域的重要突破。这些技术的问世,无疑将为人工智能领域带来新的发展机遇,也将为我们的生活带来更多便利。然而,我们也应看到,人工智能技术的发展还面临着许多挑战,如如何保证人工智能的安全性、如何避免人工智能的滥用等。这些问题需要我们在发展人工智能的同时,不断进行思考和探索。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
今日立冬,下雨好还是天晴好?老话说“冬天冷不冷,就看立冬”,咋看?

今日立冬,下雨好还是天晴好?老话说“冬天冷不冷,就看立冬”,咋看?

农夫也疯狂
2025-11-07 08:31:37
女面试官:“我肚子疼,能帮我接杯热水吗?”男子一句话,当场被录用!

女面试官:“我肚子疼,能帮我接杯热水吗?”男子一句话,当场被录用!

上海约饭局
2025-11-05 21:57:07
曾琦医生那点事,为何网友争执不下?

曾琦医生那点事,为何网友争执不下?

上峰视点
2025-11-07 10:46:14
跳水界再现黑马!王伟莹夺单人冠军,采访意外披露全红婵真实情况

跳水界再现黑马!王伟莹夺单人冠军,采访意外披露全红婵真实情况

手工制作阿歼
2025-11-07 00:17:55
宗馥莉突发重大调整,高层巨震

宗馥莉突发重大调整,高层巨震

电商派Pro
2025-11-07 09:28:27
不到5天,被点名的秦雯再迎3大噩耗,袭警只是冰山一角

不到5天,被点名的秦雯再迎3大噩耗,袭警只是冰山一角

东方不败然多多
2025-11-07 12:47:33
暖心!江苏如东渔民误捕中华鲟,放归大海

暖心!江苏如东渔民误捕中华鲟,放归大海

上观新闻
2025-11-07 09:29:08
卢秀燕两度鞠躬仍难收场,2028路渐窄,郑丽文的“清醒”救了蓝营

卢秀燕两度鞠躬仍难收场,2028路渐窄,郑丽文的“清醒”救了蓝营

健身狂人
2025-11-07 11:40:39
揭秘朝鲜“不倒翁”金永南,曾是志愿军留朝鲜,忠心辅佐金家三代

揭秘朝鲜“不倒翁”金永南,曾是志愿军留朝鲜,忠心辅佐金家三代

环球热点快评
2025-11-05 08:53:45
业界极品美女,梨窝女神Ivy Aura

业界极品美女,梨窝女神Ivy Aura

吃瓜党二号头目
2025-11-07 10:28:24
在孟加拉国,我不是在旅游,我是在见证什么叫真正的人口压力

在孟加拉国,我不是在旅游,我是在见证什么叫真正的人口压力

诗意世界
2025-11-05 18:18:26
已确认!是知名演员王祖蓝

已确认!是知名演员王祖蓝

吉刻新闻
2025-11-06 10:54:06
“79元过分了”“没事会有人买单的” 泡泡玛特直播间“翻车”,客服回应:正在核实

“79元过分了”“没事会有人买单的” 泡泡玛特直播间“翻车”,客服回应:正在核实

红星新闻
2025-11-07 10:11:43
花椒立大功!浙大团队发现:花椒36小时可清除70%的衰老细胞

花椒立大功!浙大团队发现:花椒36小时可清除70%的衰老细胞

思思夜话
2025-11-06 14:18:49
小偷偷手机反被女生暴打 躲车底不敢出来 直到警察来才“获救”

小偷偷手机反被女生暴打 躲车底不敢出来 直到警察来才“获救”

半岛晨报
2025-11-06 22:00:03
裁员裁到核心是啥体验?网友:裁到我这条静脉,都照样痛很久

裁员裁到核心是啥体验?网友:裁到我这条静脉,都照样痛很久

解读热点事件
2025-11-06 00:05:09
年轻人不买账,中年人喝不起!茅台跌破1600,终于承认只是瓶酒?

年轻人不买账,中年人喝不起!茅台跌破1600,终于承认只是瓶酒?

金融八卦女
2025-11-05 13:57:48
恭喜!34岁TVB女星宣布顺利生下第二胎!激动大晒合照!直呼和哥哥长得像!

恭喜!34岁TVB女星宣布顺利生下第二胎!激动大晒合照!直呼和哥哥长得像!

我爱追港剧
2025-11-07 08:16:36
广东阳春市一个装机容量500千瓦的小水电站拍卖,21人抢669万成交

广东阳春市一个装机容量500千瓦的小水电站拍卖,21人抢669万成交

天天话事
2025-11-07 08:43:17
世界首富马斯克,一位写烂代码的高手

世界首富马斯克,一位写烂代码的高手

码农翻身
2025-11-06 08:58:58
2025-11-07 13:31:00
睿财经官方 incentive-icons
睿财经官方
专业视角,解码财经。
697文章数 398关注度
往期回顾 全部

科技要闻

75%赞成!特斯拉股东同意马斯克天价薪酬

头条要闻

美国试射洲际弹道导弹后 俄方几乎整个领导层齐聚克宫

头条要闻

美国试射洲际弹道导弹后 俄方几乎整个领导层齐聚克宫

体育要闻

是天才更是强者,18岁的全红婵迈过三道坎

娱乐要闻

白百何回应东京电影节争议

财经要闻

老登们的社交货币全崩了

汽车要闻

小鹏X9增程版综合续航1606公里 有底气挑战赛那?

态度原创

时尚
亲子
本地
健康
军事航空

美拉德失宠了?今年冬天最流行的3个颜色,谁穿谁好看!

亲子要闻

一位二胎妈妈的血泪择校史:耗资10万,耗时6年,3天梦碎,终觉醒

本地新闻

这届干饭人,已经把博物馆吃成了食堂

超声探头会加重受伤情况吗?

军事要闻

美军两架B-52轰炸机接近委内瑞拉海岸

无障碍浏览 进入关怀版