网易首页 > 网易号 > 正文 申请入驻

阿里云刘伟光:大幅降低大模型推理价格,就是希望加速AI应用的爆发

0
分享至

5月21日,阿里云对外宣布通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。

Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元。


据了解,通义千问本次降价共覆盖9款商业化及开源系列模型。不久前发布的通义千问旗舰款大模型Qwen-Max,API输入价格降至0.04元/千tokens,降幅达67%。Qwen-Max是目前业界表现最好的中文大模型,在权威基准OpenCompass上性能追平GPT-4-Turbo,并在大模型竞技场Chatbot Arena中跻身全球前15。

业界普遍认为,随着大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

刘伟光认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式,主要有三点原因:

一是公共云的技术红利和规模效应,带来巨大的成本和性能优势。阿里云可以从模型自身和AI基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。

二是云上更方便进行多模型调用,并提供企业级的数据安全保障。阿里云可以为每个企业提供专属VPC环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。

三是云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国的北斗系统已全球开放,为什么国内还用GPS?原因现实又无奈

中国的北斗系统已全球开放,为什么国内还用GPS?原因现实又无奈

百年历史老号
2024-06-16 14:15:05
侍从揭秘宋美龄晚年:穷奢极欲仍抱怨没钱花,老年痴呆不忘蒋介石

侍从揭秘宋美龄晚年:穷奢极欲仍抱怨没钱花,老年痴呆不忘蒋介石

可乐88
2024-06-14 09:14:02
是什么影响了民营的信心?专家在回避最简单的事实

是什么影响了民营的信心?专家在回避最简单的事实

永不出场的戈多
2024-06-17 12:04:16
为啥都说明显感觉中产阶级的教育风向开始大反转了?评论太扎心了

为啥都说明显感觉中产阶级的教育风向开始大反转了?评论太扎心了

户外钓鱼哥阿勇
2024-06-17 14:04:19
欧洲杯巨大争议!比利时被“抢劫”,卢卡库太冤,名记:如同闹剧

欧洲杯巨大争议!比利时被“抢劫”,卢卡库太冤,名记:如同闹剧

奥拜尔
2024-06-18 02:27:44
宁波大学研究生录取通知书英文单词少字母,学校:将重新制作

宁波大学研究生录取通知书英文单词少字母,学校:将重新制作

澎湃新闻
2024-06-17 13:24:27
“有福我不享,没苦我硬吃”!安徽老太被全网吐槽,越看越窒息

“有福我不享,没苦我硬吃”!安徽老太被全网吐槽,越看越窒息

莫问先生
2024-06-17 12:15:55
会是什么?恩德里克:6月20日我会宣布一则震惊体育界的消息

会是什么?恩德里克:6月20日我会宣布一则震惊体育界的消息

直播吧
2024-06-18 00:50:20
广东梅州多地遭遇洪水,亲历者讲述现场!救援队长谈到这件事时沉默了

广东梅州多地遭遇洪水,亲历者讲述现场!救援队长谈到这件事时沉默了

潇湘晨报
2024-06-17 17:54:10
方舟子打假姜萍称可以肯定她压根不懂高等数学!惹怒网友被喷

方舟子打假姜萍称可以肯定她压根不懂高等数学!惹怒网友被喷

糖逗在娱乐
2024-06-17 23:03:50
最新重磅:2024年人均养老金增幅为3%,企退职工人均涨101元!

最新重磅:2024年人均养老金增幅为3%,企退职工人均涨101元!

水流云在草青青
2024-06-17 17:12:34
国足加速归化脚步!6位归化齐首发,阵容强度不亚于日本韩国

国足加速归化脚步!6位归化齐首发,阵容强度不亚于日本韩国

十点体坛
2024-06-17 15:48:48
上海女子癌症晚期,委托同学办丧礼,不料同学把她的遗体放冷冻柜

上海女子癌症晚期,委托同学办丧礼,不料同学把她的遗体放冷冻柜

华人星光
2024-06-17 19:14:29
欧洲杯惨烈战!姆巴佩鼻骨骨折,球衣全是血,2大巨星挂彩

欧洲杯惨烈战!姆巴佩鼻骨骨折,球衣全是血,2大巨星挂彩

叶青足球世界
2024-06-18 04:59:44
求复合失败的庄国栋,永不会知,这才是黄亦玫“抛弃”他的真相

求复合失败的庄国栋,永不会知,这才是黄亦玫“抛弃”他的真相

小影吉
2024-06-17 19:02:51
华为真没法比!苹果618最后时刻再降价:iPhone15全系销量霸榜!

华为真没法比!苹果618最后时刻再降价:iPhone15全系销量霸榜!

最潮家居评
2024-06-18 01:59:34
时机已到,扣押拘捕!中国海警发声:依法对菲船只采取管制措施

时机已到,扣押拘捕!中国海警发声:依法对菲船只采取管制措施

大风文字
2024-06-17 18:03:01
特斯拉三款新车曝光!确认年内推出,最早8月8日全球公开亮相

特斯拉三款新车曝光!确认年内推出,最早8月8日全球公开亮相

网上车市
2024-06-17 08:18:10
深夜突发!转融通减持来了

深夜突发!转融通减持来了

中国基金报
2024-06-18 00:11:53
20连涨来了!2024年养老金上调3%,事退和企退分别涨多少?

20连涨来了!2024年养老金上调3%,事退和企退分别涨多少?

财话连篇
2024-06-17 19:30:58
2024-06-18 07:48:49
齐鲁壹点
齐鲁壹点
找记者,上壹点!
402165文章数 78110关注度
往期回顾 全部

科技要闻

低价“6·18”没有狂欢

头条要闻

媒体:中国车出口墨西哥 引起了华盛顿的特别警惕

头条要闻

媒体:中国车出口墨西哥 引起了华盛顿的特别警惕

体育要闻

飞翔的斗牛士 如今也迎来最后一舞

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

人均养老金上调3% 怎么年轻人吵翻了?

汽车要闻

传奇新篇章 全新一代大众迈腾来了

态度原创

家居
亲子
教育
本地
游戏

家居要闻

研己实景 古典与现代的交融

亲子要闻

弟弟用力掐姐姐的脸,姐姐一声不吭看了一眼妈妈,站起来一顿操作

教育要闻

参加了科创竞赛,就能让孩子成为天子骄子吗?

本地新闻

能动司法尽“执”履责 ——“交叉执行”高效能

《寻宝英雄:力量手套》四季度登陆任天堂Switch

无障碍浏览 进入关怀版