网易首页 > 网易号 > 正文 申请入驻

大模型卷价格,向量数据库“卷”什么?

0
分享至

文|脑极体

"不是我不明白,这世界变化快",崔健在20世纪写下的这句歌词,放在公有云市场也同样适用。技术风向的变化之快,让不少人感到惊讶。

2023年初大模型、生成式AI的起飞,也带来了向量数据库的爆火。投融资项目爆发式增长,头部公有云厂商都推出了AI向量数据库的相关产品。

然而一年狂飙之后,市场逐渐退潮,全球最著名的AI项目之一AutoGPT在2024年初宣布,不再使用向量数据库。因此有人质疑,向量数据库又凉了?

不过,随着5月份公有云厂商们掀起价格战,接连调低大模型API的价格,高性价比的大模型+向量数据库,在行业应用、企业市场又显现出了一定的商业价值。

向量数据库这一年的潮起潮落,究竟是火了还是凉了?大模型正在卷价格,向量数据库又该卷什么?公有云厂商又在这一市场发挥了什么作用?今天我们就来聊聊这些问题。

向量数据库,刚刚开始

新技术的火爆,必然会伴随炒作和泡沫,但向量作为大模型理解世界的数据形式,向量数据库作为AI革命重要基建的位置,长期来看是不会动摇的。

为什么这么说?

向量数据库并不是一种特别新的数据库技术,在AI领域已经应用了七八年,谷歌在2015年就宣布使用RankBrain语义检索来处理搜索任务。如果说数据库是数据的"硬盘",那么,向量数据库就是更适合AI体质的"硬盘"。

其"AI原生"的体质,具体表现在几个方面:

1.更高的效率。AI算法,要从图像、音频和文本等海量的非结构化数据中学习,提取出以向量为表示形式的"特征",以便模型能够理解和处理。因此,向量数据库比传统基于索引的数据库有明显优势。

2.更低的成本。大模型要从一种新技术转化为产业价值,必须达到合理的投入产出比,而向量数据库可以有效减少存储和计算成本。一个公开数据是,通过腾讯云向量数据库,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%,就在于检索效率、运行稳定性、运营效率、推荐算法等,有了较大的提升。

3.更强的数据安全。有企业直言:"沉淀了几十年的内部数据是我的核心竞争力,让我无偿去公开给大模型做训练,我肯定不愿意。"想做大模型,还要确保数据的隐私安全,就必须与数据库产品做好配合,这给向量数据库的本地部署带来了广阔的需求。

4.更大的扩展性。随着大模型走向行业应用,垂直领域的AI用例不断增多,汹涌的数据洪潮和存算任务,会带来大量向量搜索的需求。而向量数据库嵌入向量的长度不受限制,具有良好的扩展性,可以根据AI用例和模型而变化,更好地处理大规模数据集。

从大模型技术标杆的OpenAI发布的GPT-4o和即将发布的GPT-5消息来看,以及国内外商业化大模型的进展来看,大模型的技术路线还没有发生颠覆性的变革,因此落地应用还是需要向量检索和向量数据库。

由此可以肯定,向量数据库市场必然还会迎来一轮增长。趋于冷静,只是2023年热情过度高涨的适当回调。

两大新势力,云是方向

据东北证券预测,到2030年,全球向量数据库市场规模有望达到500亿美元,国内向量数据库市场规模有望超过600亿人民币。向量数据库市场吸引了"群雄逐鹿",从引爆到饱和,进展迅猛。

传统数据库厂商不必多说,既有相应的能力建设,也有一定的客户基础,推出相关产品是必然。一些在AI领域积淀已久的科技大厂,如谷歌、微软、Meta、百度等大厂,都有向量数据库的技术积累,也都可以向外输出相关能力和产品。

除了这些常规面孔,向量数据库市场也吸引了新的参与者。

作为这一轮大模型投资热和创业热的主要目标之一,向量数据库领域诞生了不少创新创业公司。比如AI创业新秀Pinecone就是闭源的领跑者,凭借良好的开箱即用的产品体验,获得了非常大的增长,B轮估值达到7.5亿美元。其他竞争者大多建立在开源项目的基础上。

不过,作为创业公司,长期盈利能力还有待验证。一个主要原因,是客户大多是尝鲜、实验性质。

企业需要先将非结构化的私密数据,进行一个小的模型,进行向量化,产生一个向量的矩阵,再存储到向量数据库里,来供大模型学习和检索。这个过程涉及大量的工程化,会耗费企业许多开发人员、时间成本,一开始可能会因为AI大模型很火而对向量数据库产生兴趣,但能否真正在业务中落地还是个未知数。因此,长期付费意愿还有较大的不确定性。

另一股积极参与的新势力,就是公有云厂商。

不是所有企业都有能力自建大模型所需要的基础设施,通过MaaS(模型即服务)业务来训练应用大模型,是更灵活的选择。此外,很多政企客户往往会选择公有云或行业云来满足其业务需求,对云数据库的关注度和接受度上升,而这些用户在探索大模型时,会倾向于以整体解决方案的形式来交付,这就给了云厂商参与游戏的机会,同时也要求云厂商提供向量数据库的全栈支持。

如今头部云厂商基本建立了全生命周期AI化的向量数据库。有数据显示,企业原先接入一个大模型需要花1个月左右时间,使用某公有云的向量数据库后,3天时间即可完成,极大降低了企业的接入成本。

更何况,前不久火山引擎、阿里云、百度智能云等都围绕大模型API价格,打起了互相抄底的"价格战",意味着AI创新门槛的降低,而AI应用市场的用户规模扩大,也会带动向量数据库的使用需求。

综上,整个云AI市场的格局还在快速变化之中,风物长宜放眼量,AI Native的向量数据库,前景仍然值得期待。

接下来向量数据库卷什么?

有人可能会问了,大模型开始卷价格,那向量数据库市场正在卷什么?

需要注意的是,大模型降价是以云厂商为主,而零一万物等创业公司已经明确表示会以技术创新为竞争力,而不会(与云厂商)对标价格。云厂商在AI基础设施、商业生态、市场规模效应上的既定优势,确实也会表现在向量数据库市场。

目前来看,公有云厂商有几重特殊优势,或许会让向量数据库加速走向商业成功:

1.多元化部署。垂直行业大模型,数据都是私有机密的,客户一般不愿意放到公有云上,这对一部分支持混合多云的云厂商是一大利好,通过私有部署、分布式、混合云等多种方案,打消行业客户将数据放到云端的现实疑虑。

2.一体化AI能力。向量数据库的火爆,本质是由AI驱动的,而AI Native时代的数据工程,还有许多复杂问题尚待解决,比如检索效率,在处理大规模数据的并行任务时,保持快速响应时间是一个挑战,需要优化索引结构和搜索算法;高负载下的系统稳定性,需要确保数据库系统具备高可用性和容错能力,防止服务中断;存储海量的向量数据,成本效益比要进一步优化……目前来看,云厂商具备从底层算力集群、Maas模型平台到全栈工具链的AI能力,有望通过技术协同创新,持续优化向量数据库的性能和成本。

3.产业服务能力。各行业对AI与业务的结合热情高涨,但大多还处于尝试探索期,需要结合自身场景、AI应用、IT设施等多种因素试错并迭代。这个过程中,随叫随到、帮助客户及时解决问题的ToB服务能力,也是非常看重的。深耕产业的公有云,有望降低很多企业在AI技术革命中的机会成本。

有人说,AI云市场越来越卷了,随着大模型性能边际效益不断走低,云厂商不得不用低价换规模。但有句话:"东方不亮西方亮,黑了南方有北方。"只要公有云厂商在AI领域的产品阵营足够庞大,用多元化综合优势锁定用户,那么即使大模型收益下降,在商业回报上也不愁没有回旋的余地。

从这个角度看,或许公有云市场下一个卷起来的,就是向量大模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾:湖北女子穿皮裤相亲,男子愣了,掉头就走:白送也不要

回顾:湖北女子穿皮裤相亲,男子愣了,掉头就走:白送也不要

三叶秋文局
2024-06-15 18:14:38
“母亲借钱买的”电瓶车不合标准被没收,女孩哭得撕心裂肺!

“母亲借钱买的”电瓶车不合标准被没收,女孩哭得撕心裂肺!

走读新生
2024-06-15 07:25:14
沙特宣布不续签《石油美元协议》,美元霸权或将土崩瓦解

沙特宣布不续签《石油美元协议》,美元霸权或将土崩瓦解

低调看天下
2024-06-14 22:33:53
泪目!中国女排连扳3局逆转世界第1,提前晋级总决赛,甩日本10分

泪目!中国女排连扳3局逆转世界第1,提前晋级总决赛,甩日本10分

我爱英超
2024-06-15 22:46:13
姜萍最强衬托第13名刘奔火了,本人回应情商高,照片曝光,很帅气

姜萍最强衬托第13名刘奔火了,本人回应情商高,照片曝光,很帅气

飞鱼的说说
2024-06-15 16:14:27
中国拦截成功!拜登傻眼了,外媒:美国军工将遭遇“灭顶之灾”

中国拦截成功!拜登傻眼了,外媒:美国军工将遭遇“灭顶之灾”

星辰故事屋
2024-06-14 19:06:38
过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

浮事记
2024-06-03 11:48:21
胡歌赴台,特别要“求证一件事”!

胡歌赴台,特别要“求证一件事”!

鲁中晨报
2024-06-13 21:47:05
实在想不明白!一个球队替补,拿着300万底薪,为什么都叫他巨头

实在想不明白!一个球队替补,拿着300万底薪,为什么都叫他巨头

球毛鬼胎
2024-06-15 15:10:53
一男子怀疑妻子出轨,特意带她出国体验异域按摩,结果双方沦陷

一男子怀疑妻子出轨,特意带她出国体验异域按摩,结果双方沦陷

亲爱的落落
2024-05-07 16:58:09
黄埔四期胡琏将军个人档案:撇开意识形态,不得不为其人格击节!

黄埔四期胡琏将军个人档案:撇开意识形态,不得不为其人格击节!

小刀99
2024-06-15 14:54:13
奇瑞回应被欧盟加征21%关税:在欧洲本土生产汽车有助于减轻影响

奇瑞回应被欧盟加征21%关税:在欧洲本土生产汽车有助于减轻影响

IT之家
2024-06-15 23:16:29
欧洲杯动人1幕:1-3落败,全队站直,抚胸高歌!球迷起立对唱

欧洲杯动人1幕:1-3落败,全队站直,抚胸高歌!球迷起立对唱

叶青足球世界
2024-06-15 23:50:43
伊万:孙兴慜身价是我们全队的50倍,但我们在很多方面限制了他

伊万:孙兴慜身价是我们全队的50倍,但我们在很多方面限制了他

直播吧
2024-06-15 19:33:36
女生私密「小花瓣」形状到底什么样,才算正常

女生私密「小花瓣」形状到底什么样,才算正常

水白头
2024-06-15 01:35:03
中超积分榜:河南从降级区跃居第10,国安输球仍居第5,浙江第6

中超积分榜:河南从降级区跃居第10,国安输球仍居第5,浙江第6

直播吧
2024-06-15 22:15:04
一边出口创新高,一边大量的企业迁离倒闭,工人失业,原因是什么

一边出口创新高,一边大量的企业迁离倒闭,工人失业,原因是什么

创作者朱海平
2024-06-15 13:18:49
罗德里戈谈此前与梅西争执:我们差点打起来,最终变成互喷垃圾话

罗德里戈谈此前与梅西争执:我们差点打起来,最终变成互喷垃圾话

直播吧
2024-06-16 00:44:33
富士康“赌输”了!损失3千亿美金,郭台铭没想到,会来的这么快

富士康“赌输”了!损失3千亿美金,郭台铭没想到,会来的这么快

户外阿崭
2024-06-15 18:13:34
人社部发布最新养老金数据,2024年企退休人员平均养老金是多少?

人社部发布最新养老金数据,2024年企退休人员平均养老金是多少?

社保小达人
2024-06-15 12:19:45
2024-06-16 05:52:49
蓝鲸财经
蓝鲸财经
财经信息服务平台
97383文章数 191595关注度
往期回顾 全部

科技要闻

TikTok开始找退路了?

头条要闻

欧洲杯-23秒丢球破纪录 意大利2-1逆转阿尔巴尼亚

头条要闻

欧洲杯-23秒丢球破纪录 意大利2-1逆转阿尔巴尼亚

体育要闻

莱夫利,让困难为我让路

娱乐要闻

江宏杰秀儿女刺青,不怕刺激福原爱?

财经要闻

新情况!高层对人民币的态度180°转弯

汽车要闻

东风奕派eπ008售21.66万元 冰箱彩电都配齐

态度原创

亲子
数码
游戏
旅游
手机

亲子要闻

孩子总是便秘 家长要注意 这几点

数码要闻

低至 5747 元,爱普生 CH-TW6280T 真 4K 投影仪京东大促

魂师对决:SP唐昊返场抽取价值分析!真身幻金真是一个都少不了!

旅游要闻

如何文艺消夏?乌镇10大活动开启古镇消夏节

手机要闻

小米澎湃OS再次公布进展通报:多项问题优化中,且全是内置应用!

无障碍浏览 进入关怀版