网易首页 > 网易号 > 正文 申请入驻

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】没有OpenAI,微软还有万全之策!首个5000亿参数大模型MAl-1正在研发,前谷歌DeepMind负责人领衔,预计5月底亮相。

不需要OpenAI,微软或许也会成为AI领头羊!

外媒Information爆料称,微软内部正在开发自家首款5000亿参数的大模型MAl-1。


这恰好是,纳德拉带领团队证明自己的时候到了。

在向OpenAI投资100多亿美元之后,微软才获得了GPT-3.5/GPT-4先进模型的使用权,但终究不是长久之计。

甚至,此前有传言称,微软已经沦落为OpenAI的一个IT部门。


在过去的一年,每个人熟知的,微软在LLM方面的研究,主要集中在小体量phi的更新,比如Phi-3的开源。

而在大模型的专攻上,除了图灵系列,微软内部还未透露半点风声。

就在今天,微软首席技术官Kevin Scott证实,MAI大模型确实正在开发中。


显然,微软秘密筹备大模型的计划,是为了能够开发出一款全新LLM,能够与OpenAI、谷歌、Anthropic顶尖模型竞争。

毕竟,纳德拉曾说过,「如果OpenAI明天消失了,也无关紧要」。

「我们有的是人才、有的是算力、有的是数据,我们什么都不缺。我们在他们之下,在他们之上,在他们周围」。


看来,微软的底气,就是自己。


自研5000亿MAI-1大模型

据介绍,MAI-1大模型由前谷歌DeepMind负责人Mustafa Suleyman,负责监督。

值得一提的是,Suleyman在加入微软之前,还是AI初创Inflection AI创始人兼CEO。

创办于2022年,一年的时间,他带领团队推出了大模型Inflection(目前已更新到了2.5版本),以及日活破百万的高情商AI助手Pi。

不过因为无法找到正确的商业模式,Suleyman和另一位联创,以及大部分员工,在3月份共同加入微软。


也就是说,Suleyman和团队负责这个新项目MAI-1,会为此带来更多的前沿大模型的经验。

还是要提一句,MAI-1模型是微软自研发的,并非从Inflection模型继承而来。

据两位微软员工称,「MAI-1与Inflection之前发布的模型不同」。不过,训练过程可能会用到其训练数据和技术。

拥有5000亿参数,MAI-1的参数规模将远远超出,微软以往训练的任何小规模开源模型。

这也意味着,它将需要更多的算力、数据,训练成本也是高昂的。

为了训练这款新模型,微软已经预留了一大批配备英伟达GPU的服务器,并一直在编制训练数据以优化模型。

其中,包括来自GPT-4生成的文本,以及外部来源(互联网公共数据)的各种数据集。

大小模型,我都要

相比之下,GPT-4曾被曝出有1.8万亿参数,Meta、Mistral等AI公司发布较小开源模型,则有700亿参数。

当然,微软采取的是多管齐下的策略,即大小模型一起研发。


其中,最经典的便是Phi-3了——一个能够塞进手机的小模型,而且最小尺寸3.8B性能碾压GPT-3.5。


Phi-3 mini在量化到4bit的情况下,仅占用大约1.8GB的内存,用iPhone14每秒可生成12个token。


在网友抛出「应该用更低成本训练AI,不是更好吗」的问题后,Kevin Scott回复到:

这并不是一个非此即彼的关系。在许多AI应用中,我们结合使用大型前沿模型和更小、更有针对性的模型。我们做了大量工作,确保SLM在设备上和云中都能很好地运作。我们在训练SLM方面积累了大量经验,甚至还将其中一些工作开源,供他人研究和使用。我认为,在可预见的未来,这种大与小的结合还将继续下去。


这表明,微软既要开发成本低廉、可集成到应用中,并能在移动设备上运行的SLM,也要开发更大、更先进的AI模型。

目前,微软自称是一家「Copilot公司」。得到AI加持的Copilot聊天机器人,可以完成撰写电子邮件、快速总结文件等任务。

而未来,下一步的机会在哪?

大小模型兼顾,正体现了充满创新活力的微软,更愿意探索AI的新路径。

不给OpenAI当「IT」了?

话又说回来,自研MAI-1,并不意味着微软将会抛弃OpenAI。

首席技术官Kevin Scott在今早的帖子中首先,肯定了微软与OpenAI合作五年的坚固「友谊」。

我们一直在为合作伙伴OpenAI建造大型超算,来训练前沿的AI模型。然后,两家都会将模型,应用到自家的产品和服务中,让更多的人受益。 而且,每一代新的超算都将比上一代,更加强大,因此OpenAI训出的每个前沿模型,都要比上一个更加先进。 我们将继续沿着这条路走下去——不断构建更强大的超算,让OpenAI能够训练出引领整个行业的模型。我们的合作将会产生越来越大的影响力。

前段时间,外媒曝出了,微软和OpenAI联手打造AI超算「星际之门」,将斥资高达1150亿美元。

据称,最快将在2028年推出超算,并在2030年之前进一步扩展。


包括此前,微软工程师向创业者Kyle Corbitt爆料称,微软正在紧锣密鼓地建设10万个H100,以供OpenAI训练GPT-6。


种种迹象表明,微软与OpenAI之间合作,只会更加牢固。

此外,Scott还表示,「除了与OpenAI的合作,微软多年来一直都在让MSR和各产品团队开发AI模型」。

AI模型几乎深入到了,微软的所有产品、服务和运营过程中。团队们有时也需要进行定制化工作,不论是从零开始训模型,还是对现有模型进行微调。 未来,还会有更多类似的这样的情况。 这些模型中,一些被命名为Turing、MAI等,还有的命名为Phi,我们并将其开源。 虽然我的表达可能没有那么引人注目,但这是现实。对于我们这些极客来说,鉴于这一切在实践中的复杂性,这是一个非常令人兴奋的现实。
解密「图灵」模型

除了MAI、Phi系列模型,代号「Turing」是微软在2017年在内部开启的计划,旨在打造一款大模型,并应用到所有产品线中。


经过3年研发,他们在2020年首次发布170亿参数的T-NLG模型,创当时有史以来最大参数规模的LLM记录。


到了2021年,微软联手英伟达发布了5300亿参数的Megatron-Turing(MT-NLP),在一系列广泛的自然语言任务中表现出了「无与伦比」的准确性。


同年,视觉语言模型Turing Bletchley首次面世。

去年8月,该多模态模型已经迭代到了V3版本,而且已经整合进Bing等相关产品中,以提供更出色的图像搜索体验。


此外,微软还在2021年和2022年发布了「图灵通用语言表示模型」——T-ULRv5和T-ULRv6两个版本。

目前,「图灵」模型已经用在了,Word中的智能查询(SmartFind),Xbox中的问题匹配(Question Matching)上。

还有团队研发的图像超分辨率模型Turing Image Super-Resolution(T-ISR),已在必应地图中得到应用,可以为全球用户提高航空图像的质量。


目前,MAI-1新模型具体会在哪得到应用,还未确定,将取决于其性能表现。

顺便提一句,关于MAI-1更多的信息,可能会在5月21日-23日微软Build开发者大会上首次展示。

接下来,就是坐等MAI-1发布了。


参考资料:

https://www.theinformation.com/articles/meet-mai-1-microsoft-readies-new-ai-model-to-compete-with-google-openai?rc=epv9gi

https://www.businessinsider.com/microsoft-training-ai-model-rivals-openais-gpt-4-2024-5

https://www.linkedin.com/feed/update/urn:li:activity:7193273937273712643/


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
基德:欧文和东契奇是历史第二好的后场组合。最强的还是库里克莱

基德:欧文和东契奇是历史第二好的后场组合。最强的还是库里克莱

好火子
2024-05-28 03:37:41
C罗发布海报庆祝破纪录金靴:我不追逐纪录,纪录追随我

C罗发布海报庆祝破纪录金靴:我不追逐纪录,纪录追随我

直播吧
2024-05-28 06:18:09
普京访华后,俄教授预言:即便俄乌冲突结束,中俄关系也不会改变

普京访华后,俄教授预言:即便俄乌冲突结束,中俄关系也不会改变

娱乐的小灶
2024-05-27 20:57:00
一石二鸟!皇马猛追1.1亿球星,克罗斯游说,逼走瓜帅,痛击曼城

一石二鸟!皇马猛追1.1亿球星,克罗斯游说,逼走瓜帅,痛击曼城

叁炮体育
2024-05-28 09:54:17
中泰之战还没开打!泰国队就官宣重要决定,让国足下不来台

中泰之战还没开打!泰国队就官宣重要决定,让国足下不来台

罗掌柜体育
2024-05-28 12:21:22
保时捷中国经销商“逼宫”:一份“联合声明”如何破题复杂挑战

保时捷中国经销商“逼宫”:一份“联合声明”如何破题复杂挑战

澎湃新闻
2024-05-28 14:42:32
火辣修长,白晳动人!

火辣修长,白晳动人!

北冥说事
2024-05-28 09:29:40
爆李春江有望重返广东,朱芳雨暂别宏远,新职务曝光,杜锋回新疆

爆李春江有望重返广东,朱芳雨暂别宏远,新职务曝光,杜锋回新疆

宗介说体育
2024-05-28 10:39:12
蒋万安发出警告后,“中国台湾省”传遍国际,10国选择了一条明路

蒋万安发出警告后,“中国台湾省”传遍国际,10国选择了一条明路

大白话瞰世界
2024-05-26 09:56:58
归来仍是女王!队内对抗:朱婷三局狂砍26分!带领替补让二追三!

归来仍是女王!队内对抗:朱婷三局狂砍26分!带领替补让二追三!

金毛爱女排
2024-05-28 09:11:34
买提江把“Siu”写成“Sui”,并在指正的评论区让球迷滚

买提江把“Siu”写成“Sui”,并在指正的评论区让球迷滚

懂球帝
2024-05-28 15:33:14
上海楼市迎来重磅新政!已有开发商、购房者动起来了

上海楼市迎来重磅新政!已有开发商、购房者动起来了

第一财经资讯
2024-05-27 22:31:55
今天28日女排联赛两场,CCTV5直播,日本冲击第4场胜利

今天28日女排联赛两场,CCTV5直播,日本冲击第4场胜利

刺头体育
2024-05-28 15:55:11
看侧面都这么漂亮!乌黑靓丽的头发,迷人的气质,真的好漂亮!

看侧面都这么漂亮!乌黑靓丽的头发,迷人的气质,真的好漂亮!

粤姐说情感
2024-05-28 15:48:42
央视给台湾艺人拉清单了!点名18位台湾艺人,立场模糊恐将被封杀

央视给台湾艺人拉清单了!点名18位台湾艺人,立场模糊恐将被封杀

拾娱先生
2024-05-25 19:35:09
果然,开始鼓吹像香港那样搞房地产了

果然,开始鼓吹像香港那样搞房地产了

华商韬略毕亚军
2024-05-26 17:51:57
尼克-杨:我找科比给我的球鞋签名,他把我的球鞋扔进垃圾桶

尼克-杨:我找科比给我的球鞋签名,他把我的球鞋扔进垃圾桶

懂球帝
2024-05-28 17:30:11
孩子在外童言无忌社死的只有父母

孩子在外童言无忌社死的只有父母

阿康四岁啦
2024-05-27 14:09:34
当不成总统了?又一架美军战机被击落,美军被“驱逐”,拜登失声

当不成总统了?又一架美军战机被击落,美军被“驱逐”,拜登失声

大佬日志
2024-05-27 08:00:15
曝北京政法职业学院李同学将要退学,最终还是走到了这一步

曝北京政法职业学院李同学将要退学,最终还是走到了这一步

陕西小洁在美国
2024-05-28 07:35:05
2024-05-28 20:04:49
新智元
新智元
AI产业主平台领航智能+时代
11085文章数 65522关注度
往期回顾 全部

科技要闻

4月中国手机需求回升 iPhone出货量增长52%

头条要闻

监狱管理局原局长落马 老上级曾让假"中纪委干部"逼供

头条要闻

监狱管理局原局长落马 老上级曾让假"中纪委干部"逼供

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

昆凌晒三胎正面照,2岁妹妹超像周杰伦

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

三联屏/纯电续航318km 岚图FREE 318官图发布

态度原创

艺术
游戏
本地
房产
亲子

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

任天堂员工表示《王泪》玩家创意超预料:锅子当悬挂

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

房产要闻

有点猛!最新房价:海南每㎡跌了2000多!

亲子要闻

爸爸欺负儿子最后妈妈的反应亮了网友:啥家庭还吃双黄蛋啊

无障碍浏览 进入关怀版