网易首页 > 网易号 > 正文 申请入驻

0代码调戏千亿参数大模型,打开网页就能玩!无需注册即可体验

0
分享至

  • 明敏 发自 凹非寺
    量子位 | 公众号 QbitAI

想体验千亿参数大模型的门槛,真是越来越低了!

想让大模型回答问题?

只需在网页端输入问题,运行二三十秒,答案就噌噌生成了。

用的正是今年由Meta开源的Open Pretrained Transformer(OPT),参数量达1750亿

如果是传统在本地运行,对算力可是个大考验。

这就是由开源项目Colossal-AI支持的云端demo,无需注册即可上手体验,对硬件完全没门槛,普通笔记本电脑甚至手机就能搞定。

也就是说,完全不用懂代码的小白,现在也能调戏OPT这样的大模型了。

让我们来试玩一把~

4种任务可试玩

FAQ常见问题解答、聊天机器人、翻译、文章创作几种模式都可试玩。

一些数值也能按需自己来调整,并且不涉及到代码。

我们体验了下文章创作,开头给了一句“今天是个好日子啊”。

很快,网页就输出了一连串大好事,刚刚加薪、正在玩刺客信条、明天还要去海滩……看着让人羡慕!

还能构建个场景让聊天机器人唠上几块钱的。

随机生成的一段长对话是买手机的场景。嗯,和今天iPhone 14发布可以说是非常应景了。

感觉即便是不懂AI、不懂编程的小白也能玩转OPT的各种任务,体验过程相当丝滑。

要知道,像OPT这样千亿参数大模型的运行,一直都有着“对硬件要求高”、“成本高”的特点。

一个免费无限玩的网站,到底是怎么实现如上效果的?

开源方案快速云上部署超大模型

这还是要从其背后支持系统Colossal-AI说起。

它以“仅需几行代码就能快速部署AI大模型训练推理”而名震江湖,在GitHub上揽星超过4.7K。

这一次,是它在云上部署AI大模型的一次新突破。

主要针对OPT模型的特性,做出了在推理速度、计算量等方面的优化。

在OPT云上服务方面,提出了left padding、past cache、bucket batching技术。

OPT拥有1750亿参数量,如此规模的模型,单个GPU显存显然无法容纳。

而且推理问题不光要考虑吞吐量,还要顾及到时延问题。

针对这两方面问题,并行计算是个不错的解决思路。

尤其是Colossal-AI本身就十分擅长将一个单机模型转换成并行运行,获得并行OPT模型自然不成问题。

不过并行方案中的参数加载一直是个难题。

在这方面,Colossal-AI可以让用户只需要参考样例,简单提供参数名映射关系,即可完成模型参数的加载。

最后,再将模型导入到Colossal-AI的推理引擎中,设置相应的超参数。

到这一步,OPT主干网络的推理部分就能上线且输出有意义的结果了。

但是这还远远不够。

因为OPT是生成式模型,生成式任务需要不断循环模型的输出结果,这就导致推理中常见的batching策略无法直接应用

具体来看,由于生成任务输入的语句长度往往参差不齐,而且大部分语言阅读和书写都是从左向右的。

如果用常规的right padding,那么针对较短的句子就很难生成有意义的结果,或者需要进行复杂处理。

使用Right padding,生成侧不对齐

如果用单batch运行,效率又太低了,不可行。

所以这一回的推理部署中,增加了left padding对句子进行填充,让每个句子的生成侧(右侧)都是对齐的,同时可以生成新的单词。

Left padding

还有另一方面的问题——生成模型单次推理只能生成一个新词。

当新的输出结果生成时,它同时也成为了输入的一部分。

也就是说,生成式任务的每次计算,是需要针对新的输入序列进行重新计算的。

显然这种操作方式,重复计算太多了

尤其是对于占绝大多数计算量的Linear层来说。

所以,Colossal-AI的开发人员在模型内部引入了past cache技术

它可以暂存同一次生成任务中的Linear层的输出结果,让每次只有一个新的单词进入Linear层进行计算,并把该次的计算结果暂存,以避免重复计算。

直观来看就是酱婶儿的:

除此之外,开发人员还注意到生成式任务的计算量是参差不齐的

输入、输出的句子长短变化范围都很大。

如果用简单的batching方法,将两个相差很大的推理放在同一个批次里,就会造成大量的冗余计算。

因此他们提出了bucket batching

即按照输入句长以及输出目标句长进行桶排序,同一个桶内的序列作为一个batching,以此降低冗余。

One More Thing

不光是这次的云端demo,提供支持的Colossal-AI也是免费开源的~

任何人都能基于它低成本训练自己的大模型,并部署成云端服务。

比如在单张10GB显存的RTX 3080上,就能训练120亿参数的大模型。

较原生PyTorch提升了120倍的模型容量。

此前Colossal-AI多次在GitHub、Paper With Code热榜位列世界第一。

相关解决方案成功在自动驾驶、云计算、零售、 医药、芯片等行业知名厂商落地应用。

最近,Colossal-AI还连续入选和受邀全球超级计算机大会、国际数据科学会议、世界人工智能大会、亚马逊云科技中国峰会等国际专业盛会。

对Colossal-AI感兴趣的小伙伴,可以关注起来了~

传送门

项目开源地址:
https://github.com/hpcaitech/ColossalAI

云端demo体验地址:
https://service.colossalai.org/

参考链接:
[1]https://arxiv.org/abs/2205.01068
[2]https://sc22.supercomputing.org/
[3]https://medium.com/@yangyou_berkeley/using-state-of-the-art-ai-models-for-free-try-opt-175b-on-your-cellphone-and-laptop-7d645f535982

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“跌落神坛”的3个车载功能,根本不实用,别再花钱交智商税了

“跌落神坛”的3个车载功能,根本不实用,别再花钱交智商税了

看看娱乐与体育
2024-05-29 02:41:48
伊朗出手了,5连杀!

伊朗出手了,5连杀!

奇名呀
2024-05-28 13:00:08
好家伙!《庆余年2》开播就差评一片,观众的差评理由出奇的一致

好家伙!《庆余年2》开播就差评一片,观众的差评理由出奇的一致

娱乐圈十三太保
2024-05-16 23:10:02
几乎全是假货!利润却高达650%,为何消费者还前赴后继争相购买?

几乎全是假货!利润却高达650%,为何消费者还前赴后继争相购买?

白茶之清欢
2024-05-28 21:25:03
朝鲜半岛,突发!

朝鲜半岛,突发!

笔墨V
2024-05-26 21:00:40
密密麻麻全是人!合肥又一超大商场开业,怀疑合肥有一半人来凑热闹

密密麻麻全是人!合肥又一超大商场开业,怀疑合肥有一半人来凑热闹

石辰搞笑日常
2024-05-28 14:29:06
辽篮俱乐部给力!从6队报价中争夺下阿丘尔,亚冠杯磨合冲四连冠

辽篮俱乐部给力!从6队报价中争夺下阿丘尔,亚冠杯磨合冲四连冠

刺头体育
2024-05-28 21:54:14
国乒新鲜事:5.28传来孙颖莎、王楚钦、梁靖崑、樊振东多人消息!

国乒新鲜事:5.28传来孙颖莎、王楚钦、梁靖崑、樊振东多人消息!

小豆豆赛事
2024-05-28 21:16:24
放假通知!中小学2024暑假时间确定了,家长却表示难以接受

放假通知!中小学2024暑假时间确定了,家长却表示难以接受

凯旋学长
2024-05-25 13:32:22
小伙只因吃不了开挖机的苦,以1000块钱一部价格拍摄色情视频

小伙只因吃不了开挖机的苦,以1000块钱一部价格拍摄色情视频

胖胖侃咖
2024-05-07 08:00:08
治不了华人还治不了你?美国制裁华为不成,转头就拿自家企业出气

治不了华人还治不了你?美国制裁华为不成,转头就拿自家企业出气

开心体育站
2024-05-29 02:01:17
大陆演习后,在南海占了28个岛的越南,给了一个不同寻常的表态

大陆演习后,在南海占了28个岛的越南,给了一个不同寻常的表态

星辰故事屋
2024-05-28 20:18:55
重磅!香港市民停止恐慌“抛售”行为!感叹终于松了一口气!

重磅!香港市民停止恐慌“抛售”行为!感叹终于松了一口气!

港漂圈
2024-05-28 19:32:45
证券市场传来2大消息,今天A股将迎来惊涛骇浪,这个板块倒车接人

证券市场传来2大消息,今天A股将迎来惊涛骇浪,这个板块倒车接人

静守时光落日
2024-05-29 00:57:24
“台湾永远都不会是中国的一部分”,她遭明星当众掌掴,人人喊打

“台湾永远都不会是中国的一部分”,她遭明星当众掌掴,人人喊打

吃鱼思故渊
2024-05-27 21:54:04
18名少女遭惨绝人寰的蹂躏,2001年南靖县特大系列强奸案侦破始末

18名少女遭惨绝人寰的蹂躏,2001年南靖县特大系列强奸案侦破始末

路之意
2024-05-28 06:07:23
最新!上海市静安区委原副书记、组织部原部长宋宗德任新职

最新!上海市静安区委原副书记、组织部原部长宋宗德任新职

上观新闻
2024-05-28 17:50:25
彻底倒向美囯?拒绝中方移民,驱离中方工人,中方大怒:永不合作

彻底倒向美囯?拒绝中方移民,驱离中方工人,中方大怒:永不合作

星辰故事屋
2024-04-27 19:04:44
难怪打不赢,一个中将指挥几十个中将作战,这样的情形你敢想象吗

难怪打不赢,一个中将指挥几十个中将作战,这样的情形你敢想象吗

作家李楠枫
2024-05-20 07:47:54
埃及开枪了!这是以色列走向深渊的开始!

埃及开枪了!这是以色列走向深渊的开始!

一个坏土豆
2024-05-28 21:12:04
2024-05-29 08:24:49
量子位
量子位
追踪人工智能动态
9451文章数 175295关注度
往期回顾 全部

科技要闻

比亚迪重磅发布:最高续航2500KM

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

昆凌晒三胎正面照,2岁妹妹超像周杰伦

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

三联屏/纯电续航318km 岚图FREE 318官图发布

态度原创

艺术
旅游
时尚
公开课
军事航空

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

旅游要闻

画面曝光!五台山保安与游客起冲突 有人用手捂头

穿过这几双鞋的人基本定型了

公开课

近视只是视力差?小心并发症

军事要闻

以军装甲部队进入加沙地带南部城市拉法市中心

无障碍浏览 进入关怀版