网易首页 > 网易号 > 正文 申请入驻

击穿全网底价,通义千问大模型直降97%!1块钱能买200万tokens

0
分享至

鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

通义千问GPT-4级大模型,直接击穿全网底价!

就在刚刚,阿里突然放出大招,官宣9款通义大模型降价

其中,性能对标GPT-4的主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,也就是1块钱能买200万tokens,相当于5本《新华字典》的文字量,堪称全球大模型的性价比之王。

更直观一点对比——

Qwen-Long支持1000万tokens的长文本输入,对比GPT-4,价格仅为1/400。



超大杯新品,此番也在降价名单中:刚发布不久的通义千问超大杯Qwen-max,API输入价格也直降67%,低至0.02元/千tokens。

开源方面,Qwen1.5-72B、Qwen1.5-110B等5款开源模型的输入价格也分别直降75%以上。

这波操作,再次击穿全网最低价,可以说是专属大模型企业、程序员的618狂欢了。



1块钱200万token

来看具体降价情况:



本次降价,共覆盖9款通义千问系列模型,商业化模型、开源模型全都在列。

包括:

Qwen-Long,性能对标GPT-4,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅97%;API输出价格从0.02元/千tokens降至0.002元/千tokens,降幅90%。

Qwen-max,在权威基准OpenCompass上性能追平GPT-4-turbo,API输入价格从0.12/千tokens降至0.04元/千tokens,降幅67%。

上榜大模型竞技场排名的Qwen1.5系列开源模型方面,Qwen1.5-72B的API输入价格从0.02元/千tokens降至0.005元/千tokens,降幅75%;API输出价格从0.02元/千tokens降至0.01元/千tokens,降幅50%。



与OpenAI的GPT系列相比,降价后的通义千问系列,基本上都是1折购,性价比拉满。

以降幅最大的Qwen-Long为例,价格仅为GPT-4的1/400,性能指标上却并不逊色。



尤其在长文本方面,Qwen-Long支持最长1000万tokens的超长上下文对话,也就是能轻松处理约1500万字或1.5万页的文档。配合同步上线的文档服务,还可支持word、pdf、Markdown、epub、mobi等多种文档格式的解析和对话。

值得关注的是,不同于国内大部分厂商输入输出价格相同的定价方式,这次Qwen-Long的输入价格比输出价格降幅更大。

对此,阿里官方也给出了解释:

现在,用户结合长文本(论文、文档等)对大模型提问已经成为最常见的需求之一,所以模型输入调用量往往大于输出调用量

根据统计,真实的模型输入调用量一般是输出的8倍左右。我们把用户使用量最大的输入token价格大幅降下去,对企业来说更划算,可以更好地做到普惠。
也是希望大家把长文本用起来。

阿里一出手就是大招

说起来,这已经不是阿里云第一次击穿行业底价。

就在今年的2月29日,阿里云刚刚整过一个云产品“疯狂星期四”的大活儿:全线云产品价格直降20%,最高降幅达55%。

属实是砍自己一大刀了。



如此大手笔,底气来源是阿里云作为国内第一大公有云厂商,在长期技术积累和规模效应下,已经构建起完备的AI基础设施和Infra技术优势。

而此番诚意满满的降价,背后更是显露出大模型应用时代,这种技术红利正在成为公有云厂商的“杀手锏”之一。

在AI基础设施层面,从芯片层到平台层,阿里云已经基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建起了高弹性的AI算力调度系统。

举个例子,PAI支持10万卡量级的集群可扩展规模,超大规模训练线性拓展效率达96%。在大模型训练任务中,达到同样效果可节省超50%算力资源,性能达到全球领先水平。

推理优化方面,阿里云主要提供了三大能力:

其一,高性能优化。包括系统级的推理优化技术,以及高性能算子、高效推理框架、编译优化的能力。

其二,自适应调优。随着AI应用的多样化,一个单一的模型很难在所有场景中都保持最佳效能,自适应推理技术允许模型根据输入数据的特性和计算环境的约束,动态调整推理技术应用和计算资源选型。

其三,可扩展部署。模型推理部署资源的扩展和弹性,能解决推理服务在一定时期内的潮汐现象。

此前,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光也表示,公有云的技术红利和规模效应,会带来巨大的成本和性能优势。

这将促使“公有云+API成为企业调用大模型的主流方式”。

大模型应用时代主流路线:公有云+API

这也正是阿里云把大模型“价格战”再度推向高潮的核心原因。

尤其对于中小企业、创业团队而言,公有云+API一直以来被视作做大模型应用的性价比之选:

尽管开源模型发展势头迅猛,以Llama 3为代表的最强模型们更被认为已经有媲美GPT-4的表现,但私有化部署仍然面临着成本高昂的问题。

以使用Qwen-72B开源模型、每月1亿token用量为例,在阿里云百炼上直接调用API,每月仅需600元,私有化部署成本则平均每月超10000元。

除此之外,公有云+API模式还便于多模型调用,能提供企业级的数据安全保障。以阿里云为例,阿里云可以为企业提供专属VPC环境,做到计算隔离、存储隔离、网络隔离、数据加密。目前,阿里云已主导、深度参与10多项大模型安全相关国际国内技术标准的制定。

云厂商的开放性,还能为开发者提供更丰富的模型和工具链选择。比如,阿里云百炼平台在通义千问之外,还支持Llama系列、百川、ChatGLM等上百款国内外大模型,同时提供大模型应用一站式开发环境,可以做到5分钟开发一款大模型应用、5到10行代码即可搭建企业级RAG应用。

量子位智库在《中国AIGC应用全景报告》中提到,AIGC应用产品中,基于自建垂直大模型和API接入的产品占到将近7成。

这一数据同样从侧面佐证了“公有云+API”模式的市场潜力:在应用市场,对业务的理解和数据积累才是破局关键,在公有云+API的基础上做应用,在成本和启动速度方面都是更现实的选择。



实际上,无论是直观的价格之争,还是更深层次的AI基础设施之卷,反映出的都是,当大模型发展焦点逐步从基础模型迈向落地应用,平台厂商如何降低大模型的使用门槛,已经成为竞争的关键所在

刘伟光指出:

作为中国第一大云计算公司,阿里云这次将主流大模型API输入价格降低97%,就是希望加速AI应用的爆发。
我们预计未来大模型API的调用量会有成千上万倍的增长。

总结起来就是,一方面,对于平台厂商而言,“价格战”背后其实是基础设施、技术能力之争;另一方面,对于整个大模型行业而言,应用是否能持续爆发、进一步普及,入局门槛、运营成本已成关键因素。

如此看来,近来卷起的降价趋势,对于开发者和期待更多大模型应用的胖友们而言,不可谓不是利好消息。

你觉得呢?

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
周深演唱会到处送票没人看,开场大片空座,座位上放荧光棒撑场面

周深演唱会到处送票没人看,开场大片空座,座位上放荧光棒撑场面

西瓜爱娱娱
2024-06-02 16:57:58
山东“铁锭大巴”已开通4年,9990元吃住行全包,网友:打死不去

山东“铁锭大巴”已开通4年,9990元吃住行全包,网友:打死不去

三月柳
2024-06-03 14:25:12
要是那个单刀进了阿德耶米赛后陷入呆滞!眼里的光没了...

要是那个单刀进了阿德耶米赛后陷入呆滞!眼里的光没了...

刺头体育
2024-06-03 13:11:15
菲律宾军舰人员枪指中国海警!我方防长:中方的克制也是有限度的

菲律宾军舰人员枪指中国海警!我方防长:中方的克制也是有限度的

云姐闲聊
2024-06-03 00:06:13
“咬”起来了?许家印不承认财务造假,认为责任应由审计机构承担

“咬”起来了?许家印不承认财务造假,认为责任应由审计机构承担

王五说说看
2024-06-03 10:59:17
终于来了!字母哥正式确认加盟!人家又要对抗整个NBA……

终于来了!字母哥正式确认加盟!人家又要对抗整个NBA……

篮球实战宝典
2024-06-02 15:33:24
奥迪新Q7国内实拍!4S店:7月上市,现款降价16.5万清库存

奥迪新Q7国内实拍!4S店:7月上市,现款降价16.5万清库存

网上车市
2024-06-03 11:13:11
惠若琪:赢泰国朱婷上场呼喊队友,输给意大利时女排无暇顾此

惠若琪:赢泰国朱婷上场呼喊队友,输给意大利时女排无暇顾此

懂球帝
2024-06-03 11:33:58
24岁桑乔拒多特挽留,逼宫曼联高层:想我回去,就必须解雇滕哈赫

24岁桑乔拒多特挽留,逼宫曼联高层:想我回去,就必须解雇滕哈赫

风过乡
2024-06-03 08:01:59
AMD杀疯了!新一代最强AI芯片MI350系列登场,性能提高3500%|硅基世界

AMD杀疯了!新一代最强AI芯片MI350系列登场,性能提高3500%|硅基世界

钛媒体APP
2024-06-03 12:25:10
奥尼尔:投3分真太TMD爽了 羡慕现在的中锋 我打球时教练根本不让

奥尼尔:投3分真太TMD爽了 羡慕现在的中锋 我打球时教练根本不让

直播吧
2024-06-03 16:09:12
重要信号!楼市即将上涨了,房地产市场再次上央视,透露什么信号

重要信号!楼市即将上涨了,房地产市场再次上央视,透露什么信号

楼市味道
2024-06-03 14:05:03
逆天大瓜!孙楠和那英嘴对嘴亲吻!就是不知道对方的另一半怎么想

逆天大瓜!孙楠和那英嘴对嘴亲吻!就是不知道对方的另一半怎么想

娱乐白名单
2024-06-02 11:39:10
31岁章泽天生娃后遗症显现,儿童节晒照中,发缝变宽头发花白!

31岁章泽天生娃后遗症显现,儿童节晒照中,发缝变宽头发花白!

鑫鑫说说
2024-06-03 11:52:42
湖北省人大民族宗教侨务外事委员会主任委员朱汉桥接受审查调查

湖北省人大民族宗教侨务外事委员会主任委员朱汉桥接受审查调查

界面新闻
2024-06-03 17:07:46
事发上海!一车突然变道驶离高架上匝道,将另一车撞翻

事发上海!一车突然变道驶离高架上匝道,将另一车撞翻

新民晚报
2024-06-03 17:30:46
曾仕强:不要随便可怜别人,千万记住,心软是病,情深致命

曾仕强:不要随便可怜别人,千万记住,心软是病,情深致命

韩韩故事记
2024-06-01 18:50:07
上海财政是唯一自给率在100%以上省区...

上海财政是唯一自给率在100%以上省区...

金石随笔
2024-06-03 00:06:20
周琦续约了没?朱芳雨:我还在努力

周琦续约了没?朱芳雨:我还在努力

直播吧
2024-06-03 08:10:10
喜欢把“谢谢”二字挂在嘴边的人,往往是这三种命运,你别不信

喜欢把“谢谢”二字挂在嘴边的人,往往是这三种命运,你别不信

娱乐洞察点点
2024-06-03 12:39:03
2024-06-03 19:16:49
量子位
量子位
追踪人工智能动态
9485文章数 175309关注度
往期回顾 全部

科技要闻

特斯拉回应单踏板模式可能被禁止:暂无影响

头条要闻

美国放宽限制后 乌克兰首次使用"海马斯"袭击俄本土

头条要闻

美国放宽限制后 乌克兰首次使用"海马斯"袭击俄本土

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

接班100天,宗馥莉急了

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

时尚
本地
旅游
手机
军事航空

为什么我劝中年男人:衣不穿紧、不塞衣角?看这3组对比就明白了

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

旅游要闻

哈尔滨至香港航线正式开通

手机要闻

小米Redmi 13 4G在海外推出!联发科芯片+1亿主摄

军事要闻

泽连斯基称俄武器来自中国 外交部回应

无障碍浏览 进入关怀版