网易首页 > 网易号 > 正文 申请入驻

GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动

0
分享至


新智元报道

编辑:Aeneas 桃子

【新智元导读】今天,陆续有网友晒出OpenAI发给自己的红队邀请邮件,看起来,GPT-5已经进入红队测试了?网友们纷纷展开畅想,对Sam Altman在线「催更」。另有外媒曝出,OpenAI的一个mini版数十亿「星际之门」,最快2026年就会启动。

GPT-5已经开始红队测试了?

就在这几天,网上已经有多人晒出了OpenAI发给自己的红队录取通知书。


此前有传闻说,GPT-5将于今年6月发布。看起来,红队测试与模型发布的时间线十分吻合。


有网友直接晒出了自己收到OpenAI邮件邀请的截图。



这倒是和此前Sam Altman的说法对上了。


据悉,GPT-5早已为大家准备好,只是发布风险太大了,所以还得往后延。


三个月就能用了?

不过还有人表示,先别急,这些人只是收到了红队邀请测试而已,并没有提及具体模型。


有可能是他们填了如下的申请信息之后,才收到了邮件。


安全测试对于新版GPT如此重要的原因,一方面是ChatGPT已经有了非常大的用户数,如果在安全性上出问题,OpenAI可能也会面对像谷歌一样的舆论压力。

另一方面,To B业务是OpenAI的主要收入来源,定制化的ChatGPT能大大增强各个企业的业务能力和效率。

有人表示,红队测试会持续90-120天。


如果此次红队测试就是针对GPT-5的话,那么三个月内,我们应该就能用上它了!


而在坊间,这一传闻让群众们沸腾了!他们早已按捺不住对于GPT-5的猜测和畅想。

比如,GPT-5的上下文窗口会达到多少?


目前,Gemini 1.5 Pro是1M,Claude 3是200K,GPT-4是128K,不知道GPT-5会突破怎样的惊人纪录。


大家纷纷列出自己对于GPT-5的愿望清单——

比如10Mtoken的上下文窗口,闪电般的快速干扰,长期战略规划和推理,执行复杂开放式操作的能力,GUI / API导航,长期情境记忆,始终处于隐形状态的RAG,多模态等等。


有人猜,或许GPT-5会和Claude 3一样,提供几种不同的型号。


有人总结了目前关于GPT-5和红队的最新谣言和传闻,大致要点如下——

-OpenAI预计于今年夏天发布GPT-5,部分企业客户已收到增强功能的演示; -GPT-5「实质性更好」,相比GPT-4进行了重大升级。它需要更多的训练数据; -GPT-5的潜在功能包括生成更逼真的文本、执行翻译和创意写作等复杂任务、处理视频输入以及改进推理; -Sam Altman表示,GPT-5仍在训练中,没有确切的发布日期,广泛的安全测试可能还需数月。然而,他确认OpenAI今年将「发布一个惊人的新模型」。


在3月29日,获得内部信息的Runway CEO兼AI投资人Siqi Chen就称,GPT-5已经在推理方面取得了意想不到的阶跃函数增益。

它甚至可以靠自己就独立地弄清楚,如何让ChatGPT不用每隔一天就登录一次。


Ilya看到的东西,也许就是这个?


这是不是就意味着,在OpenAI内部,已经实现了AGI?!如果是真的,这也太惊人了。


「我不相信,只有AGI才能实现这样的能力」。


总之,网友们纷称,根据泄露的待办清单显示,OpenAI的下一项任务,就是发布GPT-5了!


大家纷纷呼唤Altman,是时间放出GPT-5了,别太吹毛求疵了,我们要求不高。


红队测试上阵,确保GPT-5安全

早在23年9月,OpenAI就曾官宣招募一批红队测试人员(Red Teaming Network),邀请不同领域专家评估模型。


不同领域专家组成的红队去寻找系统漏洞,成为确保下一代模型GPT-5安全的关键。

那么,红队测试人员一般都需要做哪些工作?

AI红队攻击的类型主要包括,提示攻击、数据中毒、后门攻击、对抗性示例、数据提取等等。

「提示攻击」是指在控制LLM的提示中注入恶意指令,从而导致大模型执行非预期的操作。

比如,今年早些时候,一名大学生利用提示获取了一家大公司的机密信息,包括开发的AI项目的代码名称,以及一些本不应该暴露的元数据。

而「提示攻击」最大的挑战是,找到威胁行为者尚未发现、利用的新提示或提示集。


红队需要测试的另一种主要攻击是「数据中毒」。

在数据中毒的情况下,威胁者会试图篡改LLM接受训练的数据,从而产生新的偏差、漏洞供他人攻击以及破坏数据的后门。

「数据中毒」会对LLM提供的结果产生严重影响,因为当LLM在中毒数据上接受训练时,它们会根据这些信息学习关联模式。

比如,关于某个品牌、政治人物的误导性,或不准确信息,进而左右人们的决策。

还有一种情况是,受到污染的数据训练后,模型提供了关于如何治疗常规疾病或病痛的不准确医疗信息,进而导致更严重的后果。

因此,红队人员需要模拟一系列数据中毒攻击,以发现LLM训练和部署流程中的任何漏洞。

除此以外,还有多元的攻击方式,邀请专家也是OpenAI确保GPT-5能够完成安全测试。

GPT-5,真的不远了

正如网友所言,红队测试开启,意味着GPT-5真的不远了。

前段时间,Altman在博客采访中曾提到,「我们今年会发布一款令人惊艳的新模型,但不知道会叫什么名字」。


尽管如此,全网都一致地将OpenAI发布的下一代模型称为GPT-5,并有传言称代号为Arrakis的项目,就是GPT-5的原型。

根据FeltSteam的预测,这个Arrakis的多模态模型,性能远超GPT-4,非常接近AGI。


另外,模型参数据称有125万亿,大约是GPT-4的100倍,并在2022年10月完成训练。

网友还总结了以往GPT系列模型发布时间表:GPT-1在2018年6月诞生,GPT-2在2019年2月,GPT-3在2020年6月,GPT-3.5在2022年12月,GPT-4仅在三个月后于2023年3月发布。

关于GPT-5的发布时间,可能在今年夏天就问世。

最近,网上流传的一张图上,显示了Y Combinator推出了GPT-5早期准入候补名单。


网友发起疑问,我们都清楚奥特曼和YC的关系不同寻常。这是否意味着他们可以在模型或信息公开之前获得访问权限?


而上月也有爆料称,已有用户对GPT-5上手体验过了,性能惊人。


外媒透露,一些企业用户已经体验到了最新版的ChatGPT。

「它真的很棒,有了质的飞跃,」一位最近见识到GPT-5效果的CEO表示。

OpenAI展示了,新模型是如何根据这位CEO公司的特殊需求和数据进行工作的。

他还提到,OpenAI还暗示模型还有其他一些未公开的功能,包括调用OpenAI正在开发的AI智能体来自主完成任务的能力。

GPT-5,一定是正确路线吗?

不过,在万众瞩目期待GPT-5面世的呼声中,也有一些不一样的声音。

比如有人觉得,GPT-5无法驾驶你的汽车,GPT-5无法解决核聚变问题,GPT-5无法治愈癌症......


另外,我们对模型的追求,非得是更智能吗?

更便宜、更快、更不费水电的模型,可能比单独的GPT-5更有革命性意义。


有人同意这个观点,表示现在实在有太多人(尤其是开发者)过于痴迷GPT-5了。

其实完全没必要这么狂热,使用当前的模型,就可以已经完成和构建太多东西。

只需正确选择利基市场,构建满足该利基市场需求的AI产品,让用户可以直观地访问AI,专注于更好的UI/UX即可。

公式很简单。我们真的有必要一味追求力大砖飞吗?


很多人表示赞同,表示甚至用GPT-3.5就可以造出非常有价值的东西。

问题不在于模型多先进,而在于怎样满足利基市场的需求。


智算中心,先从小的建起

而3月底曝出的用于训练GPT-6的千亿美元「星际之门」超算,今天又被外媒挖出了更多新的内容。

上周五,外媒The Information曝出了一个惊人消息:。


此消息一曝出,AI和云计算行业人士的提问,像雪片一样袭来——

数据中心具体位于美国的哪个地区?

会使用什么芯片?

运行数据中心所需的惊人巨量电力,从何而来?

为此,The Information又挖出了更多料,具体细节如下。

首先,之前的消息说是星际之门最早在2028年启动,而最新消息显示,最快在2026年,就会在威斯康星州启动一个功率较小的数据中心。

它的价值当然不到千亿美元,但估计仍会耗资数十亿。

其他细节如下——

用英伟达芯片,但不用英伟达网线

首先,这次数据中心的多数服务器机架,当然主要还是用的英伟达芯片。

不过有趣的是,将各个AI芯片服务器连接起来的网线,则并不会采用英伟达的产品。

据悉,OpenAI已经告知微软,自己不想再使用英伟达的InfiniBand网络设备。相反,它可能会使用基于以太网的电缆。


OpenAI「抛弃」英伟达InfiniBand,原因有二。

其一,InfiniBand太贵了!

它虽然能提供更好的性能,但它也比以太网电缆更昂贵。

其二,OpenAI不想让AI开发人员过于依赖英伟达。

要知道,目前OpenAI是全球最大的英伟达服务器集群消费者之一。并且,InifiniBand设备的性能,有时也并不可靠。

所以,英伟达会失去一大笔收入吗?

不,你想多了。

节省下来数十亿美元,OpenAI会用来购买更多的英伟达芯片,英伟达依然赚翻了。

看来,OpenAI可以接受网络性能的降低,但对于更强算力的渴望,仍然是不变的。

InfiniBand与以太网之争,已成热门话题

其实,在最近硅谷的会议和晚宴上,InfiniBand和以太网的pk,一直是个大热门话题。

所有云提供商和数据中心运营商都在预测:以太网是否会赶超InfiniBand?

绝大多数人给出的答案是肯定的。

而OpenAI放弃后者的举动,更是支持了这个论点。

英伟达的电缆到底有多贵?

这个数字说出来,十分惊人——

英伟达的网络电缆销售额,已经超过了卖GPU的钱!

英伟达首席财务官Collete Kress今年2月透露了这一惊人数据:新兴的电缆业务的年化收入,已经超过了130亿美元。

也就是说,它在12月创造了约11亿美元的收入,约占英伟达当月总收入的15%。

网络电缆卖这么贵,难怪OpenAI会选择不玩了。

参考资料:

https://www.reddit.com/r/singularity/comments/1bv8m4k/gpt5_red_teaming_underway/

https://www.theinformation.com/articles/openai-moves-to-lessen-reliance-on-some-nvidia-hardware

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
C罗模仿拉波尔特摇花手庆祝,后者评论:熟能生巧@C罗

C罗模仿拉波尔特摇花手庆祝,后者评论:熟能生巧@C罗

直播吧
2024-05-02 05:08:40
够果断!马斯克北京返美当天,连夜裁掉特斯拉500人超充团队【附电动汽车充电桩行业前景】

够果断!马斯克北京返美当天,连夜裁掉特斯拉500人超充团队【附电动汽车充电桩行业前景】

前瞻网
2024-05-02 10:27:16
给第三艘航母下水的狂喜浇点凉水

给第三艘航母下水的狂喜浇点凉水

战域笔墨
2024-05-02 01:42:48
滥用职权!连中纪委都不敢查的副国级“大老虎”、到底是何来头

滥用职权!连中纪委都不敢查的副国级“大老虎”、到底是何来头

天闻地知
2024-05-01 09:50:03
拉法行动正式开始,平民开始撤离,以色列不等待,哈马斯彻底懵了

拉法行动正式开始,平民开始撤离,以色列不等待,哈马斯彻底懵了

山河路口
2024-04-30 20:27:35
女单大爆冷!刘国栋爱徒0:3被淘汰,资格赛一轮游,孙颖莎进正赛

女单大爆冷!刘国栋爱徒0:3被淘汰,资格赛一轮游,孙颖莎进正赛

国乒二三事
2024-05-02 07:09:50
浙大邵逸夫医院楼志峰医生突然离世,终年仅51岁,值得引起重视!

浙大邵逸夫医院楼志峰医生突然离世,终年仅51岁,值得引起重视!

今日养生之道
2024-05-02 08:02:52
普京透心凉!数据分析:俄军要打29年才能占领整个顿涅茨克地区

普京透心凉!数据分析:俄军要打29年才能占领整个顿涅茨克地区

娱宙观
2024-04-30 18:59:33
福建失联一家5口很可能遇难,最后一次联系是出事前2小时

福建失联一家5口很可能遇难,最后一次联系是出事前2小时

九方鱼论
2024-05-01 23:38:37
广东两“70后”省委常委,进京履新

广东两“70后”省委常委,进京履新

极目新闻
2024-05-02 10:10:38
王石放弃千万退休金!田朴珺发文

王石放弃千万退休金!田朴珺发文

证券时报
2024-05-02 11:11:11
美国,你怎么就混成了中国的“晚清?

美国,你怎么就混成了中国的“晚清?

明叔杂谈
2024-05-01 11:47:36
福建舰冒烟明显,看来是烧油的和核动力无关

福建舰冒烟明显,看来是烧油的和核动力无关

三叔的装备空间
2024-05-02 09:34:14
众生相!凯尔特人近8年第7次进次轮 双探花一脸淡定不庆祝

众生相!凯尔特人近8年第7次进次轮 双探花一脸淡定不庆祝

厝边人侃体育
2024-05-02 09:53:12
身材傲人的美少妇

身材傲人的美少妇

娱乐的小灶
2024-04-24 01:18:18
变化大得认不出!邹市明40岁妻子容貌大变,网友:简直换了张脸

变化大得认不出!邹市明40岁妻子容貌大变,网友:简直换了张脸

体坛知识分子
2024-05-02 06:15:03
中国好兄弟向美国倒戈?前脚骗中国供电,中方:必须严惩!

中国好兄弟向美国倒戈?前脚骗中国供电,中方:必须严惩!

星辰故事屋
2024-05-01 17:27:29
冲上热搜!大唐不夜城丢刀侍卫演我五一加班,网友:这不就是在工位上坐了一天的我吗

冲上热搜!大唐不夜城丢刀侍卫演我五一加班,网友:这不就是在工位上坐了一天的我吗

极目新闻
2024-05-02 09:44:45
赵建:日元正在下一步妙棋

赵建:日元正在下一步妙棋

西京研究院
2024-05-01 23:43:51
高考后晚上,五个同学都烂醉如泥,18年后,女同学让我做亲子鉴定

高考后晚上,五个同学都烂醉如泥,18年后,女同学让我做亲子鉴定

羽怡文学工作室
2024-04-30 12:30:17
2024-05-02 13:16:49
新智元
新智元
AI产业主平台领航智能+时代
10983文章数 65461关注度
往期回顾 全部

科技要闻

4月交付量理想超问界,小米首月交付超七千

头条要闻

牛弹琴:中国邻国向美国主动献媚 对中国背后捅一刀

头条要闻

牛弹琴:中国邻国向美国主动献媚 对中国背后捅一刀

体育要闻

这场欧冠,多特的他诠释了什么叫"台柱子"

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

日元如此疯狂波动,背后谁在收割?

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

艺术
健康
旅游
公开课
军事航空

艺术要闻

造科幻之物于园林 “天工开悟——夏航雕塑展”于南池子美术馆呈现

春天野菜不知不识莫乱吃

旅游要闻

假期最受欢迎的小众目的地 会玩的人已经去了

公开课

父亲年龄越大孩子越不聪明?

军事要闻

媒体:福建舰开始海试 最快正式服役可能要到2026年

无障碍浏览 进入关怀版