网易首页 > 网易号 > 正文 申请入驻

后摩智能项之初:未来十年,如何应对生成式AI的爆炸计算需求?|WISE2023商业之王大会

0
分享至

11月28-29日,36氪WISE2023 商业之王大会在北京国际会议中心盛大举办。本届大会以“太阳照常升起 The Sun Always Rises”为主题,横跨一个主会场与六大垂直领域专场。主会场聚焦“未来3650天”、“在产业洪流中”、“进击中的万联网”、“AI与商业增量”、“全球品牌看中国”、“科技至上 共鉴创新”六大篇章重点议程,邀请全领域商业大咖展开为期两天的顶级商业对话,向现在提问,给未来答案。

后摩智能联合创始人项之初发表了主题为《存算一体,面向未来十年的算力引擎》的演讲。后摩智能是一家初创AI芯片创业公司。项之初认为,当下以ChatGPT为代表的生成式AI正发展如火如荼,但同时背后海量级的数据处理也对计算资源、计算成本带来相当大挑战。

“按照现在生成式AI的快速发展,2027年预计英伟达大概需要提供150万台服务器,每年消耗的电量,我们大概算了一下,接近一个瑞典或荷兰、阿根廷体量的国家一年耗电量。当AGI初步实现的阶段,大概需要43个美国全年的耗电量,这是地球无法承受的耗电量。”

而存算一体芯片,可以从架构层面颠覆存储与计算分离的传统范式。在芯片架构底层,将存储和计算融合,不仅可以大幅度提升单位时间的计算密度,效率大大提升,同时功耗更低、成本更低,相较于应用单一的传统架构方案,供应链风险也更低。

以下为项之初演讲正文:

大家好,我是后摩智能联合创始人项之初,下面我给大家带来《存算一体,面向未来十年的算力引擎》的主题演讲。

后摩智能联合创始人项之初

后摩智能是做一个算力芯片的初创公司,成立也快三年了。我们一直强调一个概念,最原始的算力就是我们的大脑。远古时候大脑不够用的时候,人类会用结绳石头去扩充算力。再后面,东方就进入了算盘时代,但一直停留在算盘,后来发明了各种各样算盘。

西方从1946年第一台计算机出现,就进入了一个算力爆炸的时代。第一台计算机可能只有5000次的计算量,当时重达30吨、占地170平、功耗150千瓦,但它是手工计算20万倍的计算效率,也从此让西方走上了超速发展的道路。

个人计算机以及手机的出现,包括ChatGPT,算力其实一直在重塑着人类社会的生产力。最近OpenAI代表的AI的应用,已经在飞速发展。回顾算法模型的演进历史,2012年深度学习的出现是一个转折点,AI进入了神经网络深度学习的阶段。2017年出现的transformer,当时谷歌的一篇论文《Attention Is All You Need》,让神经网络进入了自注意力阶段,transformer 为基础的大模型开始蓬勃发展。一年前,ChatGPT用两个月时间达到1亿的用户量,远远超过之前其他的APP收获上亿级用户所需要的时间。

未来算法到底会怎么演进,其实我回答不了这个问题。是不是transformer就真的统一了所有的大模型计算方式?但至少模型对算力的需求快速增长是确定的。OpenAI预测未来3.5个月算力需求就会翻一番,这是前ChatGPT时代做的预测。再到后面是不是会有更大的算力需求?这些大的模型或者说大参数量的计算,成本是非常高的。

首先训练的成本,GPT3.0基本上一次训练成本140万美元,更大的模型的话,训练成本会介于200万-1200万美元之间。除了训练成本,推理成本也很大。如果把大模型部署到google search里面,对英伟达A100的需求量将突破400万片,每年电费运营成本就有84亿美元。这是二级市场研究对英伟达服务器的需求量做的预估。

按照现在生成式AI的快速发展,2027年预计英伟达大概需要提供150万台服务器,每年消耗的电量,我们大概算了一下,接近一个瑞典或荷兰、阿根廷体量的国家一年耗电量。当AGI初步实现的阶段,大概需要43个美国全年的耗电量,这是地球无法承受的耗电量。

记得2016年AlphaGo和李世石的围棋大战,当时虽然AlphaGo以4:1赢了李世石,大家都只看到了输赢的结果,但如果分析后面的代价,AlphaGo那盘棋的电费差不多2万元人民币,李世石的大脑运转只是两碗米饭的消耗,所以他们计算效率不在一个维度上。

人是远比计算机要高效的,问题是,我们是否可以做出一个类似人脑的芯片来提供底层的算力呢?其实存算一体就是一个接近于人脑的计算架构。因为人脑其实是存储和计算是不分开的,我们的神经元细胞不会说这里是计算,那边是存储,每一个神经元细胞既是存储,也是计算。

我们大概有这么100万亿个左右的一个连接,所以形成了一个非常高效而且很智能的大脑。计算机从第一台架构发明,到现在英伟达每一代芯片迭代,比如说H100到A100就是不断增加了带宽,存储的容量能够大幅提升。

第二是功耗强的问题,芯片大概有80%-90%的功耗其实是浪费在数据的存储和计算之间的搬运,而不是在计算中使用到这些功耗。而存算一体的概念,就是在底层把存储和计算作一个融合。我们把存储的电路打开,然后把计算的电路加入进来。它其实是一个治标治本的方式,去面对今天爆炸或者说很变态的一个数据量发展需求,它会更高效、更接近于人脑的计算方式。

总结的话,存算一体芯片一是上限高,第二就是底线稳。上限高就是计算性能好,功耗更低成本也更好。就是原理上,数据不用反复搬运以后,计算密度得到了提升。所以在单位计算面积,反而可以比原来的传统架构更小。

第二个是底线会更稳,在今天国际大环境下,高制程芯片流片可能受到限制。而存算一体用28纳米制程可以做出传统架构7纳米的效果,这是供应链的一个重要保障。国内外有很多创业体已经开始了一个存算一体产业化的探索,好的技术一定不会只有一个公司在做。

特斯拉的Dojo计算机因为没有历史包袱,所以重新设计了一个适合数据爆炸时代的芯片架构,没有用原来传统的GPU的个架构,计算的效率也很高。摩根斯坦利最近给Dojo的资产估值5000亿美元。

后摩智能今年5月份发布了第一颗芯片产品叫后摩鸿途®H30,这是一颗256 tops物理算力的芯片,只有35瓦功耗,而且只用了12纳米工艺。相比于当前国际友商的畅销产品,我们的制程还落后了一代,等于我们是在落后一代情况下,做到了跟国际友商比2-3倍提升的性能,并且功耗只有它的1/2。如果不做一个底层的架构的创新,是不可能有这样的实际测试结果的。

我们的第二代芯片现在也已经在做性能提升了,我们做了一个新架构的尝试,是比较大胆的。但我们在实际的落地过程中是非常谨慎的。每一代产品都会先做一个测试验证片,然后再做一个产品片。比如我们今年5月份发布的后摩鸿途®H30,是我们在2022年就做了的验证样片。

关于第二代架构,我们其实今年也做了一个7纳米的车规级验证样片,专为transformer等车端大模型做了优化设计,并且已经通过了一个量产测试,良率、性能以及功耗的表现都有超出预期。相较于市面上全球主流的存算一体产品,在存算模块我们有了五倍以上的能效提升。我们非常期待明年推出的时候会收获很好的反响。

至于后摩智能的商业落地情况,第一代芯片我们瞄准最主要是智能驾驶,我们一直相信大模型的应用,需要更多算力,而且是计算效率更好的芯片。我们同时要瞄准了边缘端的市场,尤其是大模型出现以后,很多的解决方案商觉得,原来一些碎片细分市场会应付不过来,基于tranformer的更通用的边缘端芯片,会加速AI落地速度。

回顾一下,从第一代很计算机一瓦一兆的能效比,到2000年PC端计算机大概是一瓦一千兆,中间是一千倍的提升,现在我们手机时代处于一瓦一T的时代,又是一千倍的提升。可以再想象一下,万物智能的时代,我们需要怎样的芯片,需要怎样的算力,地球才能承受那么多的计算。人脑已经是很高效的计算,1瓦100000T的能效,也是后摩追求的梦想,存算一体可以做到1瓦1000T的效果,比如说最底层存算单元,第一代就可以接近1瓦100T的量级。

前段时间跟一些投资人沟通的时候,一些投资人会觉得云端数据中心的芯片对功耗不敏感。但大家是用静态的眼光看待问题,如果说看见通用人工智能出现,未来初代AGI是什么样子之后,会发现一定是巨量芯片需求和巨大的电耗,而不是今天理解的数据中心和服务器的概念。

未来的AGI不是一个机器,而是一种新的生物,需要巨量芯片处理器,功耗会非常敏感的,它能替代大部分人的脑力劳动,但需要几十个美国的电量,是地球无法承受的结果。后摩智能希望在这样一个发展过程中,作为一个创新架构的芯片公司贡献自己的力量,谢谢大家!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
长得漂亮,不如活得漂亮

长得漂亮,不如活得漂亮

说情感世界
2026-03-23 06:00:10
塔帅:我们将利用这种失望和怒火,去创造最奇妙的两个月

塔帅:我们将利用这种失望和怒火,去创造最奇妙的两个月

懂球帝
2026-03-23 04:46:02
日本迎印度游客翻车?机舱成水帘洞,大堂变候机厅,文化冲突藏不住了

日本迎印度游客翻车?机舱成水帘洞,大堂变候机厅,文化冲突藏不住了

最英国
2026-03-21 18:06:03
看了新加坡媒体的披露,我才知道,中国已经没必要向世界证明什么

看了新加坡媒体的披露,我才知道,中国已经没必要向世界证明什么

触摸史迹
2026-03-21 02:58:06
戛纳红毯惊现“闪钻女”,三分钟疯狂摆拍被工作人员强行带离

戛纳红毯惊现“闪钻女”,三分钟疯狂摆拍被工作人员强行带离

东方不败然多多
2026-03-22 18:27:36
花200万补课后续:380分儿子执意补课,母亲重病陪读,曝更痛隐情

花200万补课后续:380分儿子执意补课,母亲重病陪读,曝更痛隐情

观察鉴娱
2026-01-27 09:36:51
杜兰特:无论谁在数据上超越乔丹 MJ的影响力依旧无可撼动

杜兰特:无论谁在数据上超越乔丹 MJ的影响力依旧无可撼动

罗说NBA
2026-03-23 06:54:42
鲁山案新进展!女子立遗书自保,申请回避被驳,调查组已通知会面

鲁山案新进展!女子立遗书自保,申请回避被驳,调查组已通知会面

石辰搞笑日常
2026-03-23 00:55:53
国际金价“八连跌”,分析人士:全球通胀担忧成主因,摩根大通预测:年底仍可能达每盎司6300美元

国际金价“八连跌”,分析人士:全球通胀担忧成主因,摩根大通预测:年底仍可能达每盎司6300美元

纵相新闻
2026-03-22 15:44:03
教育部发布通知,幼儿园将迎来大变动,家长:幸福来得太突然!

教育部发布通知,幼儿园将迎来大变动,家长:幸福来得太突然!

另子维爱读史
2026-03-21 19:52:30
4月1日医保新规大改革!双证缺一不可,少带一件报销直接砍半

4月1日医保新规大改革!双证缺一不可,少带一件报销直接砍半

复转这些年
2026-03-22 18:24:03
玄裹:一种关于存在的视觉诗学

玄裹:一种关于存在的视觉诗学

疾跑的小蜗牛
2026-03-22 23:39:35
陈晓和毛晓彤领证了!?

陈晓和毛晓彤领证了!?

八卦疯叔
2026-03-22 09:40:10
伊朗用什么秘密武器击中美军F-35战机?“慢吞吞导弹”卡“隐身神话”BUG

伊朗用什么秘密武器击中美军F-35战机?“慢吞吞导弹”卡“隐身神话”BUG

红星新闻
2026-03-21 14:38:47
《逐玉》樊长玉身世曝光!原来,这才是魏严17年前当接盘侠的真相

《逐玉》樊长玉身世曝光!原来,这才是魏严17年前当接盘侠的真相

慢半拍sir
2026-03-22 18:46:29
连续被弃用!北京队脓包找到了,许利民亲手割掉,球迷:大快人心

连续被弃用!北京队脓包找到了,许利民亲手割掉,球迷:大快人心

弄月公子
2026-03-22 09:57:19
为什么盗版音乐已被严格限制,而中国音乐却还是没有发展起来?

为什么盗版音乐已被严格限制,而中国音乐却还是没有发展起来?

小椰的奶奶
2026-03-22 11:56:34
太励志!22岁李镇全首次入选国足:3年多前还在踢业余联赛

太励志!22岁李镇全首次入选国足:3年多前还在踢业余联赛

邱泽云
2026-03-22 16:21:25
反以色列组织烧毁捷克一处生产以色列无人机的武器中心

反以色列组织烧毁捷克一处生产以色列无人机的武器中心

财联社
2026-03-21 20:04:04
取消交强险呼声高涨!交通部重磅出手,车主集体叫好:太给力

取消交强险呼声高涨!交通部重磅出手,车主集体叫好:太给力

侃故事的阿庆
2026-03-23 05:18:54
2026-03-23 09:40:49
36氪 incentive-icons
36氪
让一部分人先看到未来
150925文章数 2848515关注度
往期回顾 全部

科技要闻

雷军、蔡崇信最新发声,提到同一件事

头条要闻

梅姨每交易1名儿童拿1千元介绍费 会同犯问有没有小孩

头条要闻

梅姨每交易1名儿童拿1千元介绍费 会同犯问有没有小孩

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

47岁“国际章”身材走样?让嘲笑她的人闭嘴

财经要闻

连续暴跌 乱世黄金失灵?

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

教育
艺术
时尚
房产
本地

教育要闻

南京学校最新通知:晚9点,立即启动作业“熔断机制”!

艺术要闻

王部长的书法太惊人,废报纸也能成大师之作!

“这条裙子”才是今年春天的顶流,怎么搭都好看

房产要闻

全城狂送1000杯咖啡!网易房产【早C计划】,即刻启动!

本地新闻

春色满城关不住|绍兴春日顶流,这片樱花海藏不住了

无障碍浏览 进入关怀版