网易首页 > 网易号 > 正文 申请入驻

4万亿个晶体管,单机可训练比GPT4大10倍的模型,最大的芯片面世

0
分享至

机器之心报道

编辑:小舟、陈萍

刚刚,芯片创业公司 Cerebras 宣布了该公司历史上最重要的消息,「我们发布了世界上最快的芯片,该芯片拥有高达 4 万亿个晶体管。」



一直以来,Cerebras 一直在往「大」的芯片方面发展,此前他们发布的晶圆级引擎(Wafer Scale Engine,WSE-1)面积比 iPad 还大。第二代 WSE-2 虽然在面积上没有变化,但却拥有惊人的 2.6 万亿个晶体管以及 85 万个 AI 优化的内核。

而现在推出的 WSE-3 包含 4 万亿个晶体管,在相同的功耗和价格下,WSE-3 的性能是之前记录保持者 WSE-2 的两倍。

此次发布的 WSE-3 是专为训练业界最大的 AI 模型而打造的,基于 5 纳米、4 万亿晶体管的 WSE-3 将为 Cerebras CS-3 人工智能超级计算机提供动力,通过 90 万个人工智能优化的计算核心,提供每秒 125 petaflops 峰值 AI 性能(1 petaflops 是指每秒 1,000,000,000,000,000(1 万亿)次浮点运算)。



WSE-3 呈正方形,边长为 21.5 厘米(面积为 46225mm^2),几乎是使用了整个 300 毫米硅片来制造一个芯片。这么看来,凭借 WSE-3,Cerebras 可以继续生产世界上最大的单芯片了。

WSE-3 大尺寸到底是个什么概念,在将其与 Nvidia H100 GPU 进行比较后发现,前者大了 57 倍,内核数量增加了 52 倍,芯片内存增加了 800 倍,内存带宽增加了 7000 倍,结构带宽增加了 3700 倍以上。而这些都是芯片实现高性能的基础。



图源:https://spectrum.ieee.org/cerebras-chip-cs3

下图展示了 WSE-3 的特点:



WSE-3



前两代晶圆级引擎的一些参数。图源:https://twitter.com/intelligenz_b/status/1768085044898275534

配备 WSE-3 的 CS-3 计算机理论上可以处理 24 万亿个参数的大型语言模型,这比 OpenAI 的 GPT-4 等顶级生成式 AI 模型的参数高出一个数量级(据传有 1 万亿个参数)。这么看来, 具有 24 万亿个参数的模型在一台机器上运行成为可能。



图源:https://www.servethehome.com/cerebras-wse-3-ai-chip-launched-56x-larger-than-nvidia-h100-vertiv-supermicro-hpe-qualcomm/

CS-3 拥有高达 1.2 PB 的巨大内存系统,旨在训练比 GPT-4 和 Gemini 还大 10 倍的下一代前沿模型。24 万亿个参数的模型可以存储在单个逻辑内存空间中,无需分区或重构,从而极大地简化了训练工作流程并提高了开发人员的工作效率。在 CS-3 上训练 1 万亿个参数模型就像在 GPU 上训练 10 亿个参数模型一样简单。



CS-3 专为满足企业和超大规模需求而构建。紧凑的四系统配置可以在一天内微调 70B 模型,同时使用 2048 个系统进行全面扩展,Llama 70B 可以在一天内从头开始训练,这对于生成式 AI 来说是前所未有的壮举。



最新的 Cerebras 软件框架为 PyTorch 2.0 和最新的 AI 模型和技术(如多模态模型、视觉 transformer、MoE 和扩散模型)提供原生支持。Cerebras 仍是唯一能为动态和非结构化稀疏性提供本机硬件加速的平台,可以将训练速度提高 8 倍。

「八年前,当我们开始这一旅程时,每个人都说晶圆级处理器是一个白日梦。我们非常自豪能够推出第三代突破性人工智能芯片,并且很高兴将 WSE-3 和 CS-3 推向市场,以帮助解决当今最大的人工智能挑战」,Cerebras 首席执行官兼联合创始人 Andrew Feldman 如是说道。

Cerebras 联合创始人兼首席执行官 Andrew Feldman



卓越的功耗效率和软件易用性

由于每个组件都针对 AI 工作进行了优化,CS-3 比任何其他系统都能以更小的空间和更低的功耗提供更高的计算性能。CS-3 性能翻倍,功耗却保持不变。

CS-3 具有卓越的易用性。相比于大模型常用的 GPU,CS-3 需要的代码减少 97%,并且能够在纯数据并行模式下训练从 1B 到 24T 参数的模型。GPT-3 大小的模型在 Cerebras 上实现只需要 565 行代码(而 GPU 需要 20,507 行 )—— 这是行业纪录。



图源:https://www.servethehome.com/cerebras-wse-3-ai-chip-launched-56x-larger-than-nvidia-h100-vertiv-supermicro-hpe-qualcomm/

目前,Cerebras 已经积压了大量来自科技企业、科研机构的订单。美国阿贡国家实验室负责计算、环境和生命科学的实验室副主任 Rick Stevens 称赞道:「Cerebras 的大胆精神将为人工智能的未来铺平道路。」

https://www.zdnet.com/article/ai-startup-cerebras-unveils-the-largest-chip-yet-for-generative-ai/

https://www.servethehome.com/cerebras-wse-3-ai-chip-launched-56x-larger-than-nvidia-h100-vertiv-supermicro-hpe-qualcomm/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男生阳气被偷走的8个行为

男生阳气被偷走的8个行为

荷兰豆爱健康
2024-04-27 17:15:30
反以色列抗议持续!美国总统候选人被捕画面曝光:双手反绑,被警察带出校园

反以色列抗议持续!美国总统候选人被捕画面曝光:双手反绑,被警察带出校园

封面新闻
2024-04-29 14:24:22
刘晓庆奶奶年纪也不低调!上身挂满珍珠像个富婆,69岁仍有女人味

刘晓庆奶奶年纪也不低调!上身挂满珍珠像个富婆,69岁仍有女人味

顶牌故事会
2024-04-28 11:19:47
16年湖南女子怀孕已6月,却被大姑姐暴打,当晚娘家上门教其做人

16年湖南女子怀孕已6月,却被大姑姐暴打,当晚娘家上门教其做人

朝暮书屋
2024-04-26 17:11:33
杜兰特:所有优秀的球队都磨合了两三年,比如掘金和凯尔特人

杜兰特:所有优秀的球队都磨合了两三年,比如掘金和凯尔特人

懂球帝
2024-04-29 16:59:17
曝青岛申办2036年夏季奥运会!与韩国印度竞争,上海成都无意

曝青岛申办2036年夏季奥运会!与韩国印度竞争,上海成都无意

米修体育
2024-04-29 18:09:32
陈奕迅武汉开唱翻白眼怒了! 前排歌迷「全场大吼」狂抢唱最后一句

陈奕迅武汉开唱翻白眼怒了! 前排歌迷「全场大吼」狂抢唱最后一句

ETtoday星光云
2024-04-29 12:16:18
真打不过了!印尼足协官宣:2名荷甲球员入籍,英超后腰在路上

真打不过了!印尼足协官宣:2名荷甲球员入籍,英超后腰在路上

小金体坛大视野
2024-04-28 18:54:16
快船拒绝31分逆转2-2独行侠 哈登33分东契奇三双欧文40分

快船拒绝31分逆转2-2独行侠 哈登33分东契奇三双欧文40分

醉卧浮生
2024-04-29 06:25:26
浙江男子咳嗽一年多,怀疑自己是肺癌!没想到元凶竟是……

浙江男子咳嗽一年多,怀疑自己是肺癌!没想到元凶竟是……

北青网-北京青年报
2024-04-29 19:37:06
沉默5天后, 俄罗斯反制到了, 冻结美最大银行资产, 欧洲态度变了

沉默5天后, 俄罗斯反制到了, 冻结美最大银行资产, 欧洲态度变了

内蒙大刘
2024-04-30 00:06:26
网传高合汽车即将复工复产并有望被一汽收购

网传高合汽车即将复工复产并有望被一汽收购

经济观察报
2024-04-29 18:09:06
巧克力价格暴涨约2倍,有烘焙店准备用完库存就下架产品

巧克力价格暴涨约2倍,有烘焙店准备用完库存就下架产品

红星新闻
2024-04-29 19:49:15
1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

回京历史梦
2024-04-23 16:52:51
图片报:皇马大巴抵达慕尼黑酒店时,一年轻球迷冲向了克罗斯

图片报:皇马大巴抵达慕尼黑酒店时,一年轻球迷冲向了克罗斯

懂球帝
2024-04-29 22:15:06
自家小区停车还要被贴“违停单”?居民吐槽:燃油车主太难了!这里不让停,那里停不了

自家小区停车还要被贴“违停单”?居民吐槽:燃油车主太难了!这里不让停,那里停不了

上观新闻
2024-04-29 11:12:14
糟蹋阴道的四大行为,你中招了吗?快停止这些行为,给她身心健康

糟蹋阴道的四大行为,你中招了吗?快停止这些行为,给她身心健康

灏漾说文
2024-01-11 15:05:35
中俄超级大棋局,美国到现在还没看懂?中国的阳谋无解!

中俄超级大棋局,美国到现在还没看懂?中国的阳谋无解!

兵国大事
2024-04-07 00:10:05
53岁大妈因丈夫不和她过性生活,不给她钱花,睡梦中将丈夫杀害

53岁大妈因丈夫不和她过性生活,不给她钱花,睡梦中将丈夫杀害

胖胖侃咖
2024-04-20 08:00:15
隆基绿能:一季度营收同比下降37.59%,净亏损23.5亿元

隆基绿能:一季度营收同比下降37.59%,净亏损23.5亿元

界面新闻
2024-04-29 21:43:21
2024-04-30 02:10:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8943文章数 141897关注度
往期回顾 全部

科技要闻

马斯克收获大礼,李彦宏梅开二度?

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

体育要闻

足球童话!执教16年,从业余联赛到德甲

娱乐要闻

田馥甄遭抵制,蔡依林却能稳稳捞金?

财经要闻

建信人寿巨亏40亿 部分产品退保率93%

汽车要闻

配置更丰富 静态体验2024款欧拉好猫

态度原创

健康
艺术
旅游
公开课
军事航空

春天野菜不知不识莫乱吃

艺术要闻

共度北京108小时 北京当代2024“凝聚”全球36座城市100余家艺术机构

旅游要闻

入境游热度持续攀升 “畅游中国”更便捷

公开课

父亲年龄越大孩子越不聪明?

军事要闻

以军轰炸加沙地带南部城市拉法 至少15人死亡

无障碍浏览 进入关怀版