网易首页 > 网易号 > 正文 申请入驻

10倍英伟达GPU:大模型专用芯片一夜成名,来自谷歌TPU创业团队

0
分享至

机器之心报道

编辑:泽南、蛋酱

能带来完全不同的大模型体验。

我们知道,大模型到 GPT-3.5 这种千亿体量以后,训练和推理的算力就不是普通创业公司所能承担的了,人们用起来速度也会很慢。

但自本周起,这种观念已成为历史。

有名为 Groq 的初创公司开发出一种机器学习处理器,据称在大语言模型任务上彻底击败了 GPU—— 比英伟达的 GPU 快 10 倍,而成本仅为 GPU 的 10%,只需要十分之一的电力。

这是在 Groq 上运行 Llama 2 的速度:

来源:https://twitter.com/emollick/status/1759633391098732967

这是 Groq(Llama 2)和 ChatGPT 面对同一个 prompt 的表现:

图源:https://x.com/JayScambler/status/1759372542530261154?s=20

尽管看起来不可思议,但事实就是如此,感兴趣的朋友不妨一试。

目前,Groq 的官网提供了试用体验,有这些模型可选:

官网地址:https://groq.com/

Groq 的处理器名为 LPU(语言处理单元),是一种新型的端到端处理单元系统,可以为具备序列组件的计算密集型应用(比如 LLM)提供极快的推理速度。

它带动的大模型速度能达到前所未有的 500 Token/s,并且实现了极低的延迟。

用硬件加速软件,总能给人一种力大砖飞的感觉。Groq 还在 LPU 上运行了最新锐的开源模型 Mixtral,模型在不到一秒的时间内回复了包含数百个单词的事实性的、引用的答案(其中四分之三的时间是用来搜索):

Groq 放出的 Demo 视频下,有人评论道:这也太快了,不该这么快。

有网友因此提出建议:因为大模型生成内容的速度太快,所以从用户体验的角度来看不应该再自动翻页了,因为人眼看不过来。

或许在 LPU 的加持下,生成式 AI 真的要如同 Gartner 最近预测所言:在两年内对搜索引擎构成巨大威胁了。仔细一想也确实合理,毕竟当年神经网络就是被 GPU 算力的发展带飞的。

至于为什么这么快?

有人分析,GPU 专为具有数百个核心的并行处理而设计,主要用于图形渲染,而 LPU 的架构旨在为 AI 计算提供确定性的性能。

LPU 的架构不同于 GPU 使用的 SIMD(单指令、多数据)模型,而是采用更精简的方法,消除了对复杂调度硬件的需求。这种设计允许有效利用每个时钟周期,确保一致的延迟和吞吐量。

能源效率是 LPU 相对于 GPU 的另一个值得注意的优势。通过减少与管理多个线程相关的开销并避免核心利用率不足,LPU 可以提供更多的每瓦计算量,将其定位为更环保的替代方案。

Groq 的芯片设计允许将多个 TSP 连接在一起,不会出现 GPU 集群中的传统瓶颈,使其具有极高的可扩展性。随着更多 LPU 的添加,这可以实现性能的线性扩展,从而简化大规模 AI 模型的硬件要求,并使开发人员更轻松地扩展其应用程序,而无需重新架构其系统。

在 A100 和 H100 相对紧缺的时代,LPU 或许会成为大模型开发商的新选择。

Groq 成立于 2016 年,这家公司的创始团队出自谷歌,曾经设计了谷歌自研 AI 芯片张量处理单元 TPU 系列。据官网介绍,Groq 公司创始人、首席执行官 Jonathan Ross 曾经承担了 TPU 的 20% 工作。

Jonathan Ross。

在去年的高性能计算会议 SC23 上,Groq 就展示过在 LPU 上运行 LLM 的全球最佳低延迟性能。当时,Groq 能够以每秒超过 280 个 Token 的速度生成回复,刷新了 Llama-2 70B 推理的性能记录。

今年 1 月,Groq 首次参与公开基准测试,就在 Anyscale 的 LLMPerf 排行榜上取得了突出的成绩,远超其他基于云的推理提供商。

图源:https://github.com/ray-project/llmperf-leaderboard?tab=readme-ov-file

人工智能已经在科技界掀起了一场风暴。2023 年可能是世界意识到人工智能将成为现实的一年,而 2024 年则是人工智能真正成为现实而不仅仅是假设的一年。这是 Jonathan Ross 曾经表达的一个观点。

当我们拥有 100 万 Token 上下文的 Gemini Pro 1.5、每秒 500 Token 推理速度的 Groq、推理能力更进一步的 GPT-5,梦想还会远吗?

参考内容:

https://blocksandfiles.com/2024/01/23/grokking-groqs-groqness/

https://siliconangle.com/2024/01/18/ai-leaders-discuss-state-ai-implemented-enterprise-cescoverage-cubeconversations/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他是中央政治局原常委,64岁主动辞去职务,临终前说:我死而无憾

他是中央政治局原常委,64岁主动辞去职务,临终前说:我死而无憾

叮当当科技
2024-11-07 10:09:17
86年,我撞见村长女儿换衣裳,她骂我流氓最终却嫁给我

86年,我撞见村长女儿换衣裳,她骂我流氓最终却嫁给我

小月文史
2024-10-30 18:41:17
左边叫公平,还是右边叫公平?

左边叫公平,还是右边叫公平?

人情皆文史
2024-10-06 01:14:55
郑钦文2:0克雷吉茨科娃,赛后4句高情商发言,引得现场掌声雷动!

郑钦文2:0克雷吉茨科娃,赛后4句高情商发言,引得现场掌声雷动!

田先生篮球
2024-11-09 07:20:22
鹿晗为关晓彤宣传新剧然后又删除,粉丝:女方看到后让他删了!

鹿晗为关晓彤宣传新剧然后又删除,粉丝:女方看到后让他删了!

西瓜爱娱娱
2024-11-08 10:42:37
油价大跌超0.37元/升后,11月油价再下降,下次油价11月20日调整

油价大跌超0.37元/升后,11月油价再下降,下次油价11月20日调整

油价早知道
2024-11-09 00:21:01
越南1亿多人,前三季度出口额2996亿美元,山东也1亿多人,出口呢

越南1亿多人,前三季度出口额2996亿美元,山东也1亿多人,出口呢

莫将离
2024-11-08 22:32:18
适当放宽!上海宣布→

适当放宽!上海宣布→

第一财经资讯
2024-11-08 14:36:49
孕妇要求邻居关掉WiFi,邻居不理即剪断整栋楼的网线,惹上官司

孕妇要求邻居关掉WiFi,邻居不理即剪断整栋楼的网线,惹上官司

户外钓鱼哥阿勇
2024-10-26 07:50:28
以接受大陆资助为由,台当局准备对中华统一促进党动手,要求解散

以接受大陆资助为由,台当局准备对中华统一促进党动手,要求解散

袁周院长
2024-11-08 16:19:29
韩国热评中国对韩国实行免签政策,韩网友:绝对不能让中国人进来

韩国热评中国对韩国实行免签政策,韩网友:绝对不能让中国人进来

小彭谈历史
2024-11-06 12:31:01
余文乐晒图庆祝立冬,网友:怎么回事?才42岁就一身老人味!

余文乐晒图庆祝立冬,网友:怎么回事?才42岁就一身老人味!

小咪侃娱圈
2024-11-08 10:04:32
中朝关系变了?紧张时刻,朝鲜直接绕过中国,反而派人向普京交底

中朝关系变了?紧张时刻,朝鲜直接绕过中国,反而派人向普京交底

趣观速评
2024-11-08 10:55:14
和别人聊天时,听到这3句话,赶紧走人,别装听不懂,惹人讨厌

和别人聊天时,听到这3句话,赶紧走人,别装听不懂,惹人讨厌

于观潭
2024-11-08 07:30:03
你见过最主动的女生是什么样的?网友们也太会了!

你见过最主动的女生是什么样的?网友们也太会了!

滑稽斑马呀
2024-06-18 18:38:21
新加坡公司招聘卡车司机,月薪$3000、做6休1!遭网友众嘲

新加坡公司招聘卡车司机,月薪$3000、做6休1!遭网友众嘲

新加坡万事通
2024-11-04 19:34:33
刚出生小宝宝有多小?网友:没想到葡萄这么大,论参照物的重要性

刚出生小宝宝有多小?网友:没想到葡萄这么大,论参照物的重要性

热闹的河马
2024-11-08 17:54:13
增程车电池衰减更严重,很多增程车主后悔了:原因不仅是电池衰减

增程车电池衰减更严重,很多增程车主后悔了:原因不仅是电池衰减

芯怡飞
2024-11-08 09:34:47
野鸡大学误人终身,人民日报曝光,湖北这4所臭名昭著,擦亮眼睛

野鸡大学误人终身,人民日报曝光,湖北这4所臭名昭著,擦亮眼睛

侃故事的阿庆
2024-11-09 07:45:03
死亡赔率!郑钦文10月10日00:00大战高芙,冠军奖金250万美元!

死亡赔率!郑钦文10月10日00:00大战高芙,冠军奖金250万美元!

郝小小看体育
2024-11-09 07:33:35
2024-11-09 10:10:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
9671文章数 142058关注度
往期回顾 全部

科技要闻

特斯拉盘中飙涨超10%,市值突破1万亿美元

头条要闻

郑钦文将勇闯年终总决赛夺冠战 世界排名步入Top5

头条要闻

郑钦文将勇闯年终总决赛夺冠战 世界排名步入Top5

体育要闻

曾在英冠坐板凳的他 是当今最火爆的射手

娱乐要闻

叶珂闪现闺蜜直播间,黄晓明评论沦陷

财经要闻

10月CPI同比上涨0.3% PPI同比下降2.9%

汽车要闻

售10.98万起 银河星舰7 EM-i开启预售

态度原创

艺术
时尚
家居
房产
公开课

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

不穿一身黑了!今年秋冬这样穿才是真时髦!

家居要闻

简约温馨 尽享舒适睡眠

房产要闻

298k㎡,百万级人口,千亿级产业!海口最强新区,未来十年规划定了!

公开课

AI如何揭开大自然和宇宙的奥秘

无障碍浏览 进入关怀版