网易首页 > 网易科技 > 网易科技 > 正文

业内:过去数月老款AI芯片降价,大模型培训成本降60%

0
分享至

1月24日消息,众所周知,开发大语言模型(LLM)成本高昂。这不仅包括模型本身的研发,还有在云端运行这些模型的费用。以人工智能初创公司Anthropic为例,云端运行模型的成本几乎占了该公司上个月收入的一半以上,这还未算上训练模型的成本。

然而,最近的技术进步有望降低大语言模型的开发和运行成本。目前尚不清楚这是否足以将大语言模型开发转变为高利润的软件业务,但它应该有助于缓解许多最紧迫的成本问题。

以Writer为例,这家初创公司专门为企业开发人工智能工具。该公司联合创始人兼首席技术官瓦西姆·阿尔谢赫(Waseem Alshikh)表示,过去三到四个月,一些老式人工智能芯片(如英伟达A100 GPU)的价格不断下滑,帮助他们将模型培训成本降低了约60%。此外,英伟达还优化了软件性能,帮助开发者在这些芯片上更快地训练和运行大型模型。

但与此同时,随着云计算服务提供商推出更多H100芯片,Writer开始使用更多英伟达新款芯片来训练大语言模型。阿尔谢赫指出,这些较新的芯片价格高昂,但在模型训练方面比A100更快。

开发者还利用各种新的培训技术和配置来降低成本。像GPT-4这样的大型语言模型实际上是由多个“专家”模型组成的,而非一个庞大的模型,每个模型专攻不同主题。这种混合专家系统(Mixture of Experts,简称MoE或ME)的计算效率更高,因为查询仅触发模型的某些部分,而非整个模型。

其他技术,如量化和大语言模型的低阶自适应,使得训练和调整模型的成本更低,且对模型性能影响微乎其微。

大语言模型开发者还找到了更高效利用硬件的方法。谷歌研究人员估计,在训练GPT-3时,OpenAI的GPU大约有80%的时间处于闲置状态,等待数据输入。换句话说,它并未充分利用GPU资源。然而,GPU经销商Together的首席科学家特里·道(Tri Dao)表示,通过采用名为FlashAttention-2的不同技术,可将闲置时间缩短至30%左右。众多开发者已开始利用这项技术,包括法国人工智能初创公司Mistral。

尽管人工智能开发人员拥有众多降低成本的工具,但并不意味着他们会全都使用。OpenAI、Anthropic等前沿模型的开发商追求卓越的芯片、人才和数据资源,因此他们可能会暂时搁置利润率目标。

例如,Facebook母公司Meta首席执行官马克·扎克伯格(Mark Zuckerberg)宣布,该公司计划在今年年底前获得3.5万个H100 GPU(总成本超过70亿美元)。这表明,实力雄厚的公司正不惜重金购买尖端芯片,即便老款GPU价格更为亲民。

此外,我们切勿忽视获取新数据以训练大语言模型的成本。像OpenAI和苹果等公司从出版商那里获得内容授权的费用看似微不足道,但未来可能会大幅增长。尽管大语言模型正逐步生成用于新模型的“合成”训练数据,但仍有许多高质量信息是它们无法复制的。(小小)

延伸阅读
相关推荐
热点推荐
订单突破20000台,刚上市就杀疯了!续航1370km,仅售9.98万

订单突破20000台,刚上市就杀疯了!续航1370km,仅售9.98万

隔壁说车老王
2024-04-26 16:20:01
没人生娃了?上海一医生称:从90年代一晚上8个剖腹产到1个没有!

没人生娃了?上海一医生称:从90年代一晚上8个剖腹产到1个没有!

户外钓鱼哥阿勇
2024-04-28 15:27:02
国运来了挡都挡不住?俄乌战争最起码给中国又争取了五年时间

国运来了挡都挡不住?俄乌战争最起码给中国又争取了五年时间

曾经年少
2024-03-05 11:38:53
周鸿祎突发怪病,发病前一天,他曾在车展上喝过陌生女子递来的水

周鸿祎突发怪病,发病前一天,他曾在车展上喝过陌生女子递来的水

剑齿猫de动物志
2024-04-28 02:55:56
布林肯趁夜色离开北京,现场冷冷清清,中方态度很明显了

布林肯趁夜色离开北京,现场冷冷清清,中方态度很明显了

楚楚的留香
2024-04-27 16:28:53
问界M7被曝智驾模式下撞上花坛!AITO客服称正配合调查

问界M7被曝智驾模式下撞上花坛!AITO客服称正配合调查

南方都市报
2024-04-28 20:32:19
出道5年热戏不断,颜值演技都无优势,白宇帆凭何能成“资源咖”

出道5年热戏不断,颜值演技都无优势,白宇帆凭何能成“资源咖”

秋暮阁
2024-04-22 12:52:36
美国藤校生敢面对美国警察,却不敢跟哈马斯喝杯咖啡

美国藤校生敢面对美国警察,却不敢跟哈马斯喝杯咖啡

关尔东
2024-04-27 00:10:14
广州女子商场跳楼砸人后续:知情人曝其轻生原因,被砸当事人发声

广州女子商场跳楼砸人后续:知情人曝其轻生原因,被砸当事人发声

洛洛女巫
2024-04-28 15:43:37
伊能静:他没有给我买过钻戒,不是小气,他一整年就没赚多少钱

伊能静:他没有给我买过钻戒,不是小气,他一整年就没赚多少钱

秀语千寻
2024-04-28 21:18:21
花990万拍下周鸿祎二手迈巴赫的男子系北京二手车商,曾喊话“1000咱都要”,笑称没有超过预算

花990万拍下周鸿祎二手迈巴赫的男子系北京二手车商,曾喊话“1000咱都要”,笑称没有超过预算

极目新闻
2024-04-28 21:17:03
美媒:美高校抗议学生享用免费咖啡三明治,背后“金主”是犹太裔金融大鳄索罗斯

美媒:美高校抗议学生享用免费咖啡三明治,背后“金主”是犹太裔金融大鳄索罗斯

红星新闻
2024-04-27 17:06:41
厉害!伊能静为秦昊新剧宣传发文堪称百万文案,她能不能教教大S

厉害!伊能静为秦昊新剧宣传发文堪称百万文案,她能不能教教大S

小村民
2024-04-28 12:13:28
布什内尔的死,唤醒了美国的下一代,以色列最大的敌人出现了

布什内尔的死,唤醒了美国的下一代,以色列最大的敌人出现了

小影的娱乐
2024-04-28 18:44:06
卢:小卡因伤缺阵绝对令人沮丧 但以我们的实力有信心赢下系列赛

卢:小卡因伤缺阵绝对令人沮丧 但以我们的实力有信心赢下系列赛

直播吧
2024-04-29 02:26:09
董宇辉和东方甄选彻底分道扬镳,与辉同行主播全部撕掉东方标签

董宇辉和东方甄选彻底分道扬镳,与辉同行主播全部撕掉东方标签

阿芒娱乐说
2024-04-28 21:15:59
哭笑不得的相亲!34岁大龄剩女被指又老又丑,晒出豪车让网友道歉

哭笑不得的相亲!34岁大龄剩女被指又老又丑,晒出豪车让网友道歉

风起云间
2024-04-27 22:49:17
惨烈!3队同分抢2张奥运门票,中国女排创2大耻辱:生死战变看客

惨烈!3队同分抢2张奥运门票,中国女排创2大耻辱:生死战变看客

开心体育站
2024-04-28 07:35:03
他是毛主席与江青的唯一后人,娶了薄一波外孙女,如今过得如何?

他是毛主席与江青的唯一后人,娶了薄一波外孙女,如今过得如何?

蹲马桶看历史
2024-04-21 17:07:44
多地高校禁止学生“五一”自行组团旅游,建议与家人朋友结伴出行

多地高校禁止学生“五一”自行组团旅游,建议与家人朋友结伴出行

澎湃新闻
2024-04-28 12:28:41
2024-04-29 03:24:49

科技要闻

特斯拉生死时速,马斯克西天取经

头条要闻

警方通报女子在卫生间被打:4人被行拘13日罚款1千元

头条要闻

警方通报女子在卫生间被打:4人被行拘13日罚款1千元

体育要闻

湖人的G4,尽人事得到了回报

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

上财万字报告深度解读Q1经济

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

本地
数码
时尚
公开课
军事航空

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

数码要闻

苹果公司将于5月7日在伦敦举行另一场发布会 可能仅面向媒体

裤子+小猫跟,这个组合气质又好看

公开课

父亲年龄越大孩子越不聪明?

军事要闻

也门胡塞击落美军"死神"无人机 并展示残骸

无障碍浏览 进入关怀版
×