网易首页 > 网易号 > 正文 申请入驻

大模型“618”开启,阿里:我降价!百度:我免费!| 最前线

0
分享至

文|周鑫雨

编辑|邓咏仪

2024年5月,互联网大模型率先迎来“618”。


制图:周鑫雨

5月20日晚间,阿里云用一条“明天,又有事发生”的公众号贴文,放出了降价风声——21日早上10:00,通义千问模型家族宣布降价,开源和闭源均有不同程度的限免和降价政策。

其中,阿里云商业化的主力大模型Qwen-Long,输入价格降幅甚至达到了97%,价格从原有的20元/百万Tokens,直降为0.5元/百万Tokens。

这一价格,以0.0003元/千Tokens的微妙优势,击穿了5月15日字节刚刚公布的“豆包大模型”的输入地板价:0.8元/百万Tokens。

然而,低价之王刚易位4小时,百度就前来“掀翻了价格地板”——文心一言两款模型ERNIE Speed和ERNIE Lite,直接宣布“免费”。

在2023年,模型的降价仍然遵从着训练效率优化和规模效应的自然趋势。

2023年11月,百度的大模型平台“文心千帆”,曾经调整了相同汉字数量对应的Token数,变相将模型的价格降低了20%。与之对应地,是文心大模型的推理成本降低到了原来的1%。

但2024年的模型价格战,开打得几乎毫无预兆。

价格断崖的开端,是一条名为“DeepSeek V2”的鲶鱼。DeepSeek的出品机构“深度求索”的背后,是坐拥过万张英伟达A100 GPU的量化基金——幻方量化。

5月6日,深度求索发布了DeepSeek大模型的新版本V2。作为模型领域的“黑马”,2360亿参数规模的DeepSeek V2,模型性能处于国产第一梯队,定价也没有什么包袱,支持32k上下文的模型API定价仅1元/百万Tokens(计算)、2元/百万Tokens(推理),是彼时百度文心4.0-8k推理价格(120元/Tokens)的1/60。


制图:周鑫雨

此后,大模型独角兽智谱AI率先加入了价格战。5月11日,智谱AI旗下的GLM-3-Turbo,价格从5元/百万Tokens,降低到了1元/Tokens。

“黑马”搅局模型定价的另一面,则是更具性价比的小模型被重提。

不少从业者对智能涌现表示,小模型的潜力还没被完全发掘,完全可以通过数据治理、效率优化等策略,以小博大,这对于下游客户而言也是更有性价比的选择。

2024年4月22日,Meta发布的开源模型Llama-3,就以70B的“小参数”,和超过20倍参数量的GPT-4在性能上掰手腕。紧接着,微软又发布了3.8B的模型Phi-3 mini,号称性能对标GPT-3.5,还能在苹果A16芯片上流畅运行。

对于下游客户而言,昂贵的大模型不够“香了”。大厂大模型的集体降价,也是在顺应市场选择。

不过,即便是价格砸穿地板,大厂们依然有利可图。大模型只是门面,大厂的渔翁之意,是通过模型卖自己的云服务。

以拥有自己的计算集群的幻方量化为例,据SemiAnalysis计算,在其算力服务力利用率最高的情况下,DeepSeek每台服务器每小时收益可达35.4美元,毛利率在70%以上。

但对于被迫卷入价格战的小厂商和初创公司而言,营收的压力将会更大。2024年5月21日,零一万物CEO李开复就直言,不参与价格战,最新模型Yi-Large的API定价仍为20元/百万Tokens。

未来,小厂们唯有在单点或多点性能上和竞争对手们拉开差距,才能分到蛋糕。

欢迎交流!

欢迎交流!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
英媒:普京将访问越南,美国反应激烈

英媒:普京将访问越南,美国反应激烈

参考消息
2024-06-17 20:02:14
华为真没法比!苹果618最后时刻再降价:iPhone15全系销量霸榜!

华为真没法比!苹果618最后时刻再降价:iPhone15全系销量霸榜!

最潮家居评
2024-06-18 01:59:34
现在月薪1万在中国是什么水平?

现在月薪1万在中国是什么水平?

陌小尘桑
2024-01-03 18:50:03
请求中方取消禁令未获满足,沉默半个月后,岸田敲定制裁中企名单

请求中方取消禁令未获满足,沉默半个月后,岸田敲定制裁中企名单

国学聚焦
2024-06-17 15:00:38
发自肺腑之言,反腐真的取得了巨大成绩,目前的状态是这样的!

发自肺腑之言,反腐真的取得了巨大成绩,目前的状态是这样的!

叒女紫121
2024-06-18 09:58:32
连胜文大陆讲话深得人心,民进党恼羞成怒,朱立伦已经想到第三层

连胜文大陆讲话深得人心,民进党恼羞成怒,朱立伦已经想到第三层

手工制作阿歼
2024-06-18 11:36:38
G5冲上全美第一热搜的不是布朗和塔图姆,竟然是另一名球员

G5冲上全美第一热搜的不是布朗和塔图姆,竟然是另一名球员

懂球哥评球
2024-06-18 11:39:45
乌克兰三叉戟哑火:7000万欧穆德里克+西甲金靴在内的赫罗纳双星

乌克兰三叉戟哑火:7000万欧穆德里克+西甲金靴在内的赫罗纳双星

直播吧
2024-06-17 23:04:33
北京50余人徒步险命丧大山,犯了什么低级错误?

北京50余人徒步险命丧大山,犯了什么低级错误?

长月小阿姨
2024-06-18 10:15:00
值了值了!杰伦去年签5年3.04亿历史最大合同 今年夺东决MVP+FMVP

值了值了!杰伦去年签5年3.04亿历史最大合同 今年夺东决MVP+FMVP

直播吧
2024-06-18 12:02:25
百度降薪;员工淬死;理想画饼,裁员回收股票;实行100天896工作制

百度降薪;员工淬死;理想画饼,裁员回收股票;实行100天896工作制

大厂往事爆料
2024-06-18 12:03:38
网友:青岛一售楼处被业主围堵!每平15000多元跌至毛坯7000多…

网友:青岛一售楼处被业主围堵!每平15000多元跌至毛坯7000多…

火山诗话
2024-06-17 06:08:53
中对澳免签的战略意义你看懂了吗?免签=最好的外宣,高招!

中对澳免签的战略意义你看懂了吗?免签=最好的外宣,高招!

钱多多多多
2024-06-17 14:21:05
丑闻!英军情五处针对中国的行动,原来是为了……

丑闻!英军情五处针对中国的行动,原来是为了……

观察者网
2024-06-18 17:27:13
他是重庆直辖市首任市委书记,查办了东北乔四,如今83岁仍康健

他是重庆直辖市首任市委书记,查办了东北乔四,如今83岁仍康健

天闻地知
2024-06-18 14:01:02
俄法院对乌军指挥官发出逮捕令,承认乌军击落俄军A-50U预警机

俄法院对乌军指挥官发出逮捕令,承认乌军击落俄军A-50U预警机

山河路口
2024-06-18 16:26:00
“人民”警察网暴人民,丧尽天良!

“人民”警察网暴人民,丧尽天良!

观风者
2024-06-14 10:06:53
知名酒店错标“40元/晚”被订千余单 消费者:已遭强制取消,补救措施没诚意丨追踪到底

知名酒店错标“40元/晚”被订千余单 消费者:已遭强制取消,补救措施没诚意丨追踪到底

封面新闻
2024-06-17 19:20:43
爽了!皮尔斯致敬加内特名场面:Anything is possible

爽了!皮尔斯致敬加内特名场面:Anything is possible

直播吧
2024-06-18 12:48:16
贝林厄姆面部异常

贝林厄姆面部异常

星耀国际足坛
2024-06-17 23:31:51
2024-06-18 18:12:49
36氪
36氪
让一部分人先看到未来
144704文章数 2839364关注度
往期回顾 全部

科技要闻

第一批小米车主,已经开始卖车了

头条要闻

卸任7年后 主动交代问题的市政协原主席被逮捕

头条要闻

卸任7年后 主动交代问题的市政协原主席被逮捕

体育要闻

对于凯尔特人来说 谁是MVP根本不重要

娱乐要闻

被曝新恋情,张碧晨王琳凯发声辟谣

财经要闻

官方:税务部门没有倒查30年的安排

汽车要闻

全球最低价 现代IONIQ 5N预售价39.88万

态度原创

游戏
教育
时尚
旅游
军事航空

P5总监:并不反感《暗喻幻想》被归类为JRPG

教育要闻

“数学天才”姜萍接受采访,竟不知谢惠民的数学分析是什么

成熟女人的穿搭法则,高级感很重要,打造出精致感的LOOK

旅游要闻

直航加免签,利好中国—古巴旅游往来

军事要闻

"局部战术暂停"后 以军袭击加沙地带多地

无障碍浏览 进入关怀版