网易首页 > 网易号 > 正文 申请入驻

阿里云刘伟光:大幅降低大模型推理价格 就是希望加速AI应用的爆发

0
分享至

5月21日,阿里云对外宣布通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。

Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元。


据了解,通义千问本次降价共覆盖9款商业化及开源系列模型。不久前发布的通义千问旗舰款大模型Qwen-Max,API输入价格降至0.04元/千tokens,降幅达67%。Qwen-Max是目前业界表现最好的中文大模型,在权威基准OpenCompass上性能追平GPT-4-Turbo,并在大模型竞技场Chatbot Arena中跻身全球前15。

业界普遍认为,随着大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

刘伟光认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式,主要有三点原因:

一是公共云的技术红利和规模效应,带来巨大的成本和性能优势。阿里云可以从模型自身和AI基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。

二是云上更方便进行多模型调用,并提供企业级的数据安全保障。阿里云可以为每个企业提供专属VPC环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。

三是云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

来源:环球网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
让二追三!中国女排逆转土耳其,进军世界女排联赛总决赛

让二追三!中国女排逆转土耳其,进军世界女排联赛总决赛

懂球帝
2024-06-15 22:47:15
90分钟绝杀2-1,中超第5又倒下,踢不过倒数第2,河南队2球爆冷

90分钟绝杀2-1,中超第5又倒下,踢不过倒数第2,河南队2球爆冷

北门儿
2024-06-15 22:45:03
国足18强赛分档确定,避开日韩跟两支送分童子一组,出线指日可待

国足18强赛分档确定,避开日韩跟两支送分童子一组,出线指日可待

罗掌柜体育
2024-06-15 19:30:47
沙特背刺中方?2000亿基建项目绕过中国,中国乐了:结果反转!

沙特背刺中方?2000亿基建项目绕过中国,中国乐了:结果反转!

小陆搞笑日常
2024-06-14 19:44:12
黄一山带患罕见病儿子回港,28岁儿子终身坐轮椅毛毯从头包到脚

黄一山带患罕见病儿子回港,28岁儿子终身坐轮椅毛毯从头包到脚

娱乐白名单
2024-06-13 12:05:22
小杨哥在海外疯狂搞钱

小杨哥在海外疯狂搞钱

电商报APP
2024-06-14 11:13:23
广东男篮潜力新星铁了心离队,拒绝归队夏训,或被杜锋彻底放弃!

广东男篮潜力新星铁了心离队,拒绝归队夏训,或被杜锋彻底放弃!

中国篮坛快讯
2024-06-15 15:23:17
拜登彻底失算!外媒:美国想卖,中国也不买了

拜登彻底失算!外媒:美国想卖,中国也不买了

趣说世界哈
2024-06-14 07:40:08
2-0!瑞士“廉价前锋”破门,利物浦巨星全场隐身,破欧洲杯纪录

2-0!瑞士“廉价前锋”破门,利物浦巨星全场隐身,破欧洲杯纪录

汪星人哟
2024-06-15 21:50:55
儿子在马航遇难,多年后父亲收到儿子信息,坚信儿子活在平行时空

儿子在马航遇难,多年后父亲收到儿子信息,坚信儿子活在平行时空

文雅笔墨
2024-06-14 19:06:57
《中餐厅8》终于开录!嘉宾阵容雄厚,这次想不火都难了

《中餐厅8》终于开录!嘉宾阵容雄厚,这次想不火都难了

娱乐圈十三太保
2024-06-14 22:59:49
增幅257%!华为首度登顶!

增幅257%!华为首度登顶!

EETOP半导体社区
2024-06-13 11:34:00
西方用核磁共振疯狂敛财,中国好不容易突破技术,为何白菜价销售

西方用核磁共振疯狂敛财,中国好不容易突破技术,为何白菜价销售

奇点使者
2024-06-14 22:50:02
俄罗斯已经无法对我们构成威胁

俄罗斯已经无法对我们构成威胁

笔墨V
2024-06-15 17:26:49
深圳“大鹏所城”城墙因暴雨发生小范围坍塌:系全国重点文保单位,无人员伤亡

深圳“大鹏所城”城墙因暴雨发生小范围坍塌:系全国重点文保单位,无人员伤亡

澎湃新闻
2024-06-15 19:28:26
苏-57开启猎杀模式!普京赌上未来,要跟北约打一场“大决战”

苏-57开启猎杀模式!普京赌上未来,要跟北约打一场“大决战”

刘振起观点
2024-06-13 10:39:53
小牌大耍!女星周也黑脸对待央视记者,“六公主”直接晒视频明涵

小牌大耍!女星周也黑脸对待央视记者,“六公主”直接晒视频明涵

萌神木木
2024-06-14 18:09:04
邓小平与王毅的一张珍贵合影,当年的一支新秀,如今已是参天大树

邓小平与王毅的一张珍贵合影,当年的一支新秀,如今已是参天大树

燕小姐说历史
2023-10-29 08:54:41
魔兽世界:暴雪推送开服版本,正式服时间锁定,国服60级PLUS来了

魔兽世界:暴雪推送开服版本,正式服时间锁定,国服60级PLUS来了

胖哥游戏说
2024-06-15 17:33:03
真没白等!10个连续跌停,抄底大军涌进5700%,撬开45万手封单

真没白等!10个连续跌停,抄底大军涌进5700%,撬开45万手封单

惜别的海岸
2024-06-15 08:10:41
2024-06-16 00:18:44
中国网资讯
中国网资讯
身边事,天下事,新闻资讯
205937文章数 186719关注度
往期回顾 全部

科技要闻

TikTok开始找退路了?

头条要闻

563支AI队伍和姜萍考同一份试卷:最高34分 都没进决赛

头条要闻

563支AI队伍和姜萍考同一份试卷:最高34分 都没进决赛

体育要闻

莱夫利,让困难为我让路

娱乐要闻

江宏杰秀儿女刺青,不怕刺激福原爱?

财经要闻

新情况!高层对人民币的态度180°转弯

汽车要闻

东风奕派eπ008售21.66万元 冰箱彩电都配齐

态度原创

亲子
教育
游戏
时尚
艺术

亲子要闻

我国超三成3岁以下婴幼儿家庭有入托需求

教育要闻

期末复习如何更加有效?班主任要做好这三点——

不可思议的让二追三,宝蓝队击败BGM,晋级传奇杯决赛!

艳压四方的刘亦菲,也没能赢她

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

无障碍浏览 进入关怀版