网易首页 > 网易号 > 正文 申请入驻

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

0
分享至


新智元报道

编辑:乔杨 好困

【新智元导读】来自加州大学圣地亚哥分校和上海交通大学的几位研究者发表了他们关于「一致性大语言模型」的研究成果(Consistency LLM),使用Jacobi解码算法实现并行化并使用「一致性损失函数」,将文字生成速度提升了2.4-3.4倍。

DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门,成为了Hacker News等许多科技媒体的头版头条。

Hacker News热榜上紧随其后的则是今年2月发布的论文「一致性大语言模型」。

到底是什么样的成果,竟然可以顶着AlphaFold 3的热度出圈?

这篇论文不仅切中了大语言模型推理速度慢的痛点,而且实现了性能大幅度提升。


CLLM在多个下游任务上都取得了2-3倍的加速,且推理过程没有引入额外成本。在GSM8K和Spider两个任务中,相比今年1月刚发布的Medusa 2都有了明显提升。


论文的两位共同一作都是一年级博士生,分别是来自上海交通大学的寇思麒和来自加州大学圣地亚哥分校的胡岚翔,他们的指导老师是交大的邓志杰教授和UCSD的张昊教授,后者也是Vicuna/vLLM/Chatbot Arena等项目的作者。

目前这篇论文已经被ICML 2024会议接收,所用代码已在GitHub上开源,可以在HuggingFace仓库上看到模型多个版本的权重。


https://huggingface.co/cllm


https:// gith ub.com/hao-ai-lab/Consistency_LLM

LLM苦推理速度久矣

以GPT和Llama家族为代表的大语言模型虽然可以出色地完成人类语言任务,但代价也是巨大的。

除了参数量大,推理速度慢、token吞吐量低也是经常被人诟病的问题,尤其是对于上下文信息较多的任务,因此大语言模型的部署和在现实中的应用十分受限。

Reddit上经常有开发者询问减少LLM推理时间的方法,有人曾经发帖,在64G GPU内存、4块英伟达T4芯片上用langchain部署7B的Llama 2模型后,需要10秒钟回答较小的查询,较大的查询则需要3分钟。


为了提高推理速度和token吞吐量,研究者们想了很多方法,比如去年很流行的vLLM推理框架,就是通过改进注意力算法来提高语言模型的效率。

CLLM的思路则放在了解码上,使用更适合并行的Jacobi算法替代传统的自回归方法。

Jacobi解码算法

自回归解码算法在运行时,每次只能基于已知序列生成1个token,这种基于时间序列的算法对GPT之类的大模型非常不友好,要想实现并行化的推理,就必须修改模型架构或者添加额外的构件。


这篇研究则提出,使用Jacobi解码算法取代传统的自回归,每一次解码可以同时生成序列后n个token。

Jacobi解码源自用于求解非线性方程的Jacobi和Gauss-Seidel定点迭代,并被证明与使用贪婪解码的自回归生成相同。

给定一个初始序列时,首先生成n个随机token作为起始点,之后将这n个token的优化问题看作n个非线性方程组,里面含有的n个变量可以基于Jacobi迭代并行求解。

每一次Jacobi迭代可以预测出一个或多个正确的token,进行多轮迭代直至收敛,就完成了n个token的预测,迭代的过程形成Jacobi轨迹。


本篇文章所用Jacobi算法的灵感追溯至2021年的一篇论文,用求解非线性方程组加速神经网络计算。


论文地址:https://arxiv.org/pdf/2002.03629

以及张昊组的另一篇论文lookahead decoding:


论文地址:https://arxiv.org/pdf/2402.02057

一致性语言模型

使用Jacobi算法解码时,大语言模型的推理过程可以被归纳为——一致地将雅可比轨迹 上的任何点 映射到固定点 ∗ ,而这个训练目标和一致性模型非常相似。

「一致性模型」最初由ICML 2023的一篇论文提出,作者是四位大名鼎鼎的OpenAI研究科学家:Ilya Sutskever、宋飏、Mark Chen以及DALLE3的作者之一Prafulla Dhariwal。


论文地址:https://arxiv.org/pdf/2303.01469

因此,这项研究提出在目标语言模型的基础上,联合两种损失函数来调整CLLM——一致性损失(consistency loss)保证同时预测多个token,自回归损失防止CLLM偏离目标语言模型,保证生成质量的同时提升效率。


实验结果也比较理想,CLLM方法确实可以在接近目标模型生成效果的同时,大幅加快生成速度,从原有的约40 token/s提升至超过120 token/s。



除了推理性能的提升,这种解码方法也在更抽象的层次上提升了LLM的能力。

由于不再是逐个生成token而是同时预测序列后面的n个token,CLLM似乎理解了一个重要的语言概念——词语搭配。

它会更频繁地生成固定的词组和术语,比如「与...交谈」,或者编程语言中「if...else...」这样的常用语法结构,这似乎也更符合人类使用语言的习惯。

参考资料:

https://hao-ai-lab.github.io/blogs/cllm/

https://news.ycombinator.com/item?id=40302201

https://www.reddit.com/r/MachineLearning/comments/15851sr/d_how_do_i_reduce_llm_inferencing_time/

https://aws.amazon.com/what-is/autoregressive-models/


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南高三学霸戴宇菁,生命定格在高考前夕,她最终的遗言让人落泪

湖南高三学霸戴宇菁,生命定格在高考前夕,她最终的遗言让人落泪

山茶谈
2024-06-19 22:28:52
广西已明确,6月20日起执行全民补贴计划,凭身份证申领

广西已明确,6月20日起执行全民补贴计划,凭身份证申领

武鸣论坛网
2024-06-20 18:58:43
一天连下两道禁令!欧盟拒中国茶叶入境!刻意针对还是另有原因?

一天连下两道禁令!欧盟拒中国茶叶入境!刻意针对还是另有原因?

兰子记
2024-06-20 15:37:23
解密黄家驹的真正死因:不是意外,前世是金丝猴,最终死于降头术

解密黄家驹的真正死因:不是意外,前世是金丝猴,最终死于降头术

洞鉴历史
2024-04-29 16:50:12
不会出口欧美!拜登做梦也没想到,中国出手会这么狠

不会出口欧美!拜登做梦也没想到,中国出手会这么狠

科技龙
2024-06-12 10:23:18
曝45岁伏明霞离婚,净身出户原因揭晓,71岁百亿丈夫只说6个字

曝45岁伏明霞离婚,净身出户原因揭晓,71岁百亿丈夫只说6个字

深度知局
2024-05-20 19:25:53
日子久了,就被国央企腌入味儿了

日子久了,就被国央企腌入味儿了

身在国企心在江湖
2024-06-19 11:23:18
知情人曝陈晓婚变内幕:男方宁愿净身出户也要离婚,女方饱受折磨

知情人曝陈晓婚变内幕:男方宁愿净身出户也要离婚,女方饱受折磨

萌神木木
2024-06-19 13:31:14
凯特王妃能顺利复出,并非是威廉的意思,而是查尔斯的深谋远虑

凯特王妃能顺利复出,并非是威廉的意思,而是查尔斯的深谋远虑

王姐懒人家常菜
2024-06-20 01:02:16
南海的斧头帮

南海的斧头帮

美第奇效应
2024-06-20 01:20:33
令人胆寒,广东一女子做小蝴蝶处脱毛,结束后发现有摄像头正对她

令人胆寒,广东一女子做小蝴蝶处脱毛,结束后发现有摄像头正对她

妮子说美食
2024-06-20 15:53:17
笑麻了!江苏一女子在医院诊断出“包皮过长”,医院工作人员回应

笑麻了!江苏一女子在医院诊断出“包皮过长”,医院工作人员回应

滑稽斑马呀
2024-06-20 19:48:11
加拿大男篮官宣20人名单:亚历山大领衔12名NBA现役 周志豪在列

加拿大男篮官宣20人名单:亚历山大领衔12名NBA现役 周志豪在列

醉卧浮生
2024-06-20 09:48:40
炸裂!四川小伙将女友借给兄弟应付催婚,不料俩人假戏真做

炸裂!四川小伙将女友借给兄弟应付催婚,不料俩人假戏真做

朝暮书屋
2024-05-07 14:04:15
持续发酵!俞莉教授已经被处分,据悉黑人留学生并不买账!

持续发酵!俞莉教授已经被处分,据悉黑人留学生并不买账!

新时代的两性情感
2024-06-20 16:07:20
签约广东队?男篮“一哥”被曝已离队,或加盟宏远驰援杜锋!

签约广东队?男篮“一哥”被曝已离队,或加盟宏远驰援杜锋!

绯雨儿
2024-06-20 14:47:45
山东新增一所本科大学,招生计划公布

山东新增一所本科大学,招生计划公布

鲁中晨报
2024-06-20 21:07:03
肇庆一工地被泥土淹没,3人遭埋压!其中1人已无生命体征

肇庆一工地被泥土淹没,3人遭埋压!其中1人已无生命体征

南方都市报
2024-06-20 21:04:07
6月19日,这才是今天娱乐圈最离谱的瓜!

6月19日,这才是今天娱乐圈最离谱的瓜!

紫雨说娱乐
2024-06-19 15:00:01
4名俄罗斯恶魔被发出死亡追缉令!

4名俄罗斯恶魔被发出死亡追缉令!

凡事一定有办法13119
2024-06-20 12:22:40
2024-06-20 23:24:49
新智元
新智元
AI产业主平台领航智能+时代
11176文章数 65539关注度
往期回顾 全部

科技要闻

小米SU7流量泼天,富贵却被蔚来接住了

头条要闻

机井打完电却难通 投资2400多万的高标准农田设施烂尾

头条要闻

机井打完电却难通 投资2400多万的高标准农田设施烂尾

体育要闻

绿军的真老大,开始备战下赛季了

娱乐要闻

叶舒华参加柯震东生日聚会,五毒俱全

财经要闻

楼市加速去库存 收储扩围至县级以上城市

汽车要闻

售价11.79-14.39万元 新一代哈弗H6正式上市

态度原创

时尚
家居
本地
数码
公开课

你还想成为流川枫吗?

家居要闻

自然开放 实现灵动可变空间

本地新闻

2024·合肥印象|用崭新视角对话城市发展

数码要闻

优派推出 4K 160Hz 显示器 VX2759-4K-PRO,首发 2099 元

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版