网易首页 > 网易号 > 正文 申请入驻

10倍英伟达GPU:大模型专用芯片一夜成名,来自谷歌TPU创业团队

0
分享至



机器之心报道

编辑:泽南、蛋酱

能带来完全不同的大模型体验。

我们知道,大模型到 GPT-3.5 这种千亿体量以后,训练和推理的算力就不是普通创业公司所能承担的了,人们用起来速度也会很慢。

但自本周起,这种观念已成为历史。

有名为 Groq 的初创公司开发出一种机器学习处理器,据称在大语言模型任务上彻底击败了 GPU—— 比英伟达的 GPU 快 10 倍,而成本仅为 GPU 的 10%,只需要十分之一的电力。

这是在 Groq 上运行 Llama 2 的速度:

来源:https://twitter.com/emollick/status/1759633391098732967



这是 Groq(Llama 2)和 ChatGPT 面对同一个 prompt 的表现:

图源:https://x.com/JayScambler/status/1759372542530261154?s=20



尽管看起来不可思议,但事实就是如此,感兴趣的朋友不妨一试。

目前,Groq 的官网提供了试用体验,有这些模型可选:



官网地址:https://groq.com/

Groq 的处理器名为 LPU(语言处理单元),是一种新型的端到端处理单元系统,可以为具备序列组件的计算密集型应用(比如 LLM)提供极快的推理速度。

它带动的大模型速度能达到前所未有的 500 Token/s,并且实现了极低的延迟。



用硬件加速软件,总能给人一种力大砖飞的感觉。Groq 还在 LPU 上运行了最新锐的开源模型 Mixtral,模型在不到一秒的时间内回复了包含数百个单词的事实性的、引用的答案(其中四分之三的时间是用来搜索):



Groq 放出的 Demo 视频下,有人评论道:这也太快了,不该这么快。

有网友因此提出建议:因为大模型生成内容的速度太快,所以从用户体验的角度来看不应该再自动翻页了,因为人眼看不过来。



或许在 LPU 的加持下,生成式 AI 真的要如同 Gartner 最近预测所言:在两年内对搜索引擎构成巨大威胁了。仔细一想也确实合理,毕竟当年神经网络就是被 GPU 算力的发展带飞的。

至于为什么这么快?

有人分析,GPU 专为具有数百个核心的并行处理而设计,主要用于图形渲染,而 LPU 的架构旨在为 AI 计算提供确定性的性能。

LPU 的架构不同于 GPU 使用的 SIMD(单指令、多数据)模型,而是采用更精简的方法,消除了对复杂调度硬件的需求。这种设计允许有效利用每个时钟周期,确保一致的延迟和吞吐量。

能源效率是 LPU 相对于 GPU 的另一个值得注意的优势。通过减少与管理多个线程相关的开销并避免核心利用率不足,LPU 可以提供更多的每瓦计算量,将其定位为更环保的替代方案。

Groq 的芯片设计允许将多个 TSP 连接在一起,不会出现 GPU 集群中的传统瓶颈,使其具有极高的可扩展性。随着更多 LPU 的添加,这可以实现性能的线性扩展,从而简化大规模 AI 模型的硬件要求,并使开发人员更轻松地扩展其应用程序,而无需重新架构其系统。

在 A100 和 H100 相对紧缺的时代,LPU 或许会成为大模型开发商的新选择。



Groq 成立于 2016 年,这家公司的创始团队出自谷歌,曾经设计了谷歌自研 AI 芯片张量处理单元 TPU 系列。据官网介绍,Groq 公司创始人、首席执行官 Jonathan Ross 曾经承担了 TPU 的 20% 工作。

Jonathan Ross。



在去年的高性能计算会议 SC23 上,Groq 就展示过在 LPU 上运行 LLM 的全球最佳低延迟性能。当时,Groq 能够以每秒超过 280 个 Token 的速度生成回复,刷新了 Llama-2 70B 推理的性能记录。

今年 1 月,Groq 首次参与公开基准测试,就在 Anyscale 的 LLMPerf 排行榜上取得了突出的成绩,远超其他基于云的推理提供商。



图源:https://github.com/ray-project/llmperf-leaderboard?tab=readme-ov-file



人工智能已经在科技界掀起了一场风暴。2023 年可能是世界意识到人工智能将成为现实的一年,而 2024 年则是人工智能真正成为现实而不仅仅是假设的一年。这是 Jonathan Ross 曾经表达的一个观点。

当我们拥有 100 万 Token 上下文的 Gemini Pro 1.5、每秒 500 Token 推理速度的 Groq、推理能力更进一步的 GPT-5,梦想还会远吗?



参考内容:

https://blocksandfiles.com/2024/01/23/grokking-groqs-groqness/

https://siliconangle.com/2024/01/18/ai-leaders-discuss-state-ai-implemented-enterprise-cescoverage-cubeconversations/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贸易战升级?中国3月出口额远低于市场预期,“脱钩断链”加剧?

贸易战升级?中国3月出口额远低于市场预期,“脱钩断链”加剧?

王五说说看
2024-04-12 17:36:41
网上有人呼吁:没人看报纸了咋还养那么多报社,应该砍掉报社把钱省下来!

网上有人呼吁:没人看报纸了咋还养那么多报社,应该砍掉报社把钱省下来!

可达鸭面面观
2024-04-12 20:48:48
铁路部门新规,60岁以上的老人乘坐火车高铁,可以享受的福利待遇

铁路部门新规,60岁以上的老人乘坐火车高铁,可以享受的福利待遇

南风西洲
2024-04-12 19:37:59
史诗级利好!A股新“国九条”,美元狂飙外资砸盘导致A股跳水

史诗级利好!A股新“国九条”,美元狂飙外资砸盘导致A股跳水

看财经show
2024-04-12 16:31:41
央视感动中国出炉,这一次,却没人能感动起来

央视感动中国出炉,这一次,却没人能感动起来

顾礼先生
2024-04-11 16:41:39
不当总统不去基辅!“乌克兰战败,特朗普就不会让美国再次伟大”

不当总统不去基辅!“乌克兰战败,特朗普就不会让美国再次伟大”

鹰眼Defence
2024-04-12 18:14:32
我国自主研发!国内首台,正式交付

我国自主研发!国内首台,正式交付

极目新闻
2024-04-12 09:24:20
俄罗斯“核泄漏”让反贼们嗨了,称比日本核污水还严重,被现实啪啪打脸

俄罗斯“核泄漏”让反贼们嗨了,称比日本核污水还严重,被现实啪啪打脸

不掉线电波
2024-04-12 09:19:52
比亚迪总裁王传福:靠嫂子卖嫁妆读大学,成功后将嫂子宠成公主

比亚迪总裁王传福:靠嫂子卖嫁妆读大学,成功后将嫂子宠成公主

羊2004
2024-04-12 17:32:43
王健林大消息!北京万达广场实业有限公司股东变更,险资接盘

王健林大消息!北京万达广场实业有限公司股东变更,险资接盘

每日经济新闻
2024-04-12 17:50:21
越南女首富被判死刑背后:104箱证据、2700人被传唤,一场罕见的判决

越南女首富被判死刑背后:104箱证据、2700人被传唤,一场罕见的判决

红星新闻
2024-04-12 19:48:41
当事大学生回应“租车现3毫米划痕被索赔6.8万”:视频均为客观陈述,租车公司是送车上门

当事大学生回应“租车现3毫米划痕被索赔6.8万”:视频均为客观陈述,租车公司是送车上门

极目新闻
2024-04-12 14:43:24
卖掉油车,换了电车,如今开了2年多,终于明白网上说的都是真的

卖掉油车,换了电车,如今开了2年多,终于明白网上说的都是真的

西山来客
2024-04-11 10:07:13
换表后费用翻倍?燃气公司单季度净利润暴增824%

换表后费用翻倍?燃气公司单季度净利润暴增824%

中国经营报
2024-04-12 13:42:40
黄磊一家5口公务舱被偶遇!18岁黄多多被骂太拽,黄磊被批架子大

黄磊一家5口公务舱被偶遇!18岁黄多多被骂太拽,黄磊被批架子大

缘木不求娱
2024-04-12 15:32:49
从火车站被带走的“老虎”,敛财超1.2亿!落马前4天还露面

从火车站被带走的“老虎”,敛财超1.2亿!落马前4天还露面

政知新媒体
2024-04-12 17:57:04
突发!传万达出售总部大厦……

突发!传万达出售总部大厦……

1号时务局
2024-04-12 21:36:33
中国突发事件!近2500名投资者致函公安部 要求与英国谈判“归还272亿元比特币”

中国突发事件!近2500名投资者致函公安部 要求与英国谈判“归还272亿元比特币”

FX168链界观察
2024-04-12 16:30:05
被称作“世界第一县衙”,某县政府办公楼气派无比,据说花了20亿

被称作“世界第一县衙”,某县政府办公楼气派无比,据说花了20亿

可达鸭面面观
2024-04-12 23:47:40
美租车企业巨头下单10万辆特斯拉,却被马斯克坑惨了!投资人承认“这是场灾难”

美租车企业巨头下单10万辆特斯拉,却被马斯克坑惨了!投资人承认“这是场灾难”

西游日记
2024-04-12 22:58:11
2024-04-13 06:42:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8879文章数 141883关注度
往期回顾 全部

科技要闻

中国8大互联网上市公司净利猛增,市值猛跌

头条要闻

景区月薪6000元招聘动物观察员:要求遇见野人跑得快

头条要闻

景区月薪6000元招聘动物观察员:要求遇见野人跑得快

体育要闻

0-1!前英超冠军崩了,近10轮输掉6场,争冠太刺激了:前3只差1分

娱乐要闻

突发!歌手朴宝蓝意外离世,年仅30岁

财经要闻

中邮保险投资失利 所投中加基金前途未卜

汽车要闻

宾利Mulliner Batur将于北京车展首发

态度原创

旅游
家居
游戏
教育
亲子

旅游要闻

小众目的地免签,但直飞航班运力不足

家居要闻

至简至静 感受源自岁月的诗情画意

永劫无间S12赛季开启,妖刀姬青花旗袍皮肤来袭,新英雄即将上线

教育要闻

浙大给家长寄成绩单,学学全面发展的相关短语

亲子要闻

萌娃车库跳科目三!真的太可爱了

无障碍浏览 进入关怀版