网易首页 > 网易号 > 正文 申请入驻

OpenAI把80%算力砸向训练,向量数据库却偷偷吃掉90%推理

0
分享至

2024年,全球向量数据库市场规模从4.2亿美元飙到12.8亿,增速205%。但比这数字更扎眼的是另一组对比:企业部署大模型时,训练成本只占10%,推理和存储吃掉剩下的90%。向量数据库恰好卡在这90%的咽喉位置。

Prabu Jayant在Medium上发了篇长文,把这事说透了。他的核心观点很直接:「如果说大语言模型(LLM,Large Language Model)是推理引擎,向量数据库就是长期记忆。」没有后者,你的AI就是个金鱼脑——每次对话从零开始,连你三分钟前说过什么都记不住。

SQL查得到"UserID 505",但查不到"像雨天周日下午那种视频"

传统关系型数据库(SQL)是精确匹配的大师。输入确定关键词,返回确定结果,毫秒级响应。但现实世界的问题从来不是这么问的。

用户想要的是"文档里讲太阳耀斑法律风险的那些",是"和这张图风格接近的设计参考",是"上次聊过的那个预算方案"——这些问题的共同特征是:没有标准答案,只有语义相近。

SQL数据库不理解"意思",它只认识字符串。你把"King"和"Queen"存进去,它们就是四个字母和五个字母的区别,和"Toaster"没有任何本质不同。

向量嵌入(Embeddings)解决的就是这个断层。它把文本、图像、音频这些非结构化数据,转换成几百到几千维的数字坐标。在这个高维数学空间里,"King"和"Queen"的向量距离可能只有0.3,而"King"和"Toaster"隔着整个银河系。

Jayant打了个比方:这就像是给每个概念发了一张宇宙中的三维坐标身份证。查询不再是"等于",而是"靠近"。

RAG架构:让大模型从"闭卷考试"变成"开卷带笔记"

2023年开始爆火的RAG(检索增强生成,Retrieval-Augmented Generation),核心依赖就是向量数据库。它的工作流很直白:用户提问→向量数据库检索相关上下文→把上下文塞进提示词→大模型生成回答。

没有向量数据库的RAG,就像让学生闭卷考试但允许翻书——书倒是给你了,没目录、没页码、没索引,翻到天亮也找不到考点。

Jayant列了组数据:企业级知识库动辄百万级文档,纯靠大模型上下文窗口硬塞,成本会指数级爆炸。GPT-4的128K上下文窗口看着宽敞,塞进去10万字后,推理延迟和费用都够喝一壶。向量检索先把范围缩到最相关的3-5段,再扔给大模型,成本和延迟都能压到原来的1/10以下。

更隐蔽的收益是准确性。大模型的"幻觉"(Hallucination,编造不存在的信息)在RAG架构下被显著抑制——因为它被强制要求基于检索到的真实材料作答,而不是凭参数记忆瞎编。

向量数据库的战场:从"能搜"到"快、准、省"

这个赛道现在挤满玩家。Pinecone靠托管服务起家,Weaviate主打开源和GraphQL接口,Milvus在十亿级向量检索上性能夸张,pgvector则直接寄生在PostgreSQL生态里,让存量用户零迁移成本上车。

Jayant特别提到了检索质量的三层漏斗:召回率(Recall,找没找全)、精确率(Precision,找得准不准)、延迟(Latency,多快给出结果)。这三者构成不可能三角,不同场景需要不同取舍。

电商搜索要的是"快+准",宁可漏掉几个长尾商品,也不能让用户等超过200毫秒;科研文献检索要的是"全+准",等个两三秒可以忍,但关键论文漏掉就是事故;合规审查场景则要"全+快",批量扫描百万份合同,漏一条风险条款或拖慢审批流程,都是真金白银的损失。

技术细节上的分化也很明显。HNSW(Hierarchical Navigable Small World,分层可导航小世界)算法在速度和召回率之间平衡得最好,但内存占用高;IVF(Inverted File Index,倒排文件索引)更省资源,适合超大规模但精度稍逊。没有银弹,只有场景适配。

被低估的瓶颈:嵌入模型和存储成本

向量数据库本身只是链条的一环。上游的嵌入模型(Embedding Model)决定了"坐标身份证"的质量,下游的存储和计算决定了能撑多大规模。

Jayant指出一个反直觉的事实:OpenAI的text-embedding-ada-002曾经是企业首选,但2024年开源模型(如BGE、E5系列)在MTEB(Massive Text Embedding Benchmark,大规模文本嵌入基准测试)榜单上全面反超,且成本只有API调用的1/50。很多企业开始自建嵌入流水线,把向量数据库从"黑盒服务"的一部分,变成可完全掌控的基础设施。

存储侧的压力同样真实。一个10亿向量的库,如果每向量768维、用float32存储,裸数据就接近3TB。加上索引结构,实际占用可能翻3-5倍。云厂商的托管服务按存储+查询量计费,账单跑得比业务增长还快。压缩技术(量化、降维)和分层存储(热数据SSD、冷数据对象存储)成为刚需,不是优化项。

Jayant的观察是:「向量数据库正在从'AI应用的配件'变成'数据架构的核心'。」这个转变的标志性信号是,传统数据库巨头(Oracle、MongoDB、Snowflake)2024年全部内嵌了向量检索能力,不是插件,是原生支持。

当数据库的老炮们集体转身,说明这不再是边缘技术,而是主战场的基础设施。下一个问题是:你的数据 pipeline,准备好把"语义查询"当成一等公民了吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国际原油价格持续走低,WTI原油跌2.22%,布伦特原油跌1.22%

国际原油价格持续走低,WTI原油跌2.22%,布伦特原油跌1.22%

每日经济新闻
2026-04-06 16:00:10
陈光标没有骗张雪,将豪车变现给嫣然天使捐款1000万,晒出汇款单

陈光标没有骗张雪,将豪车变现给嫣然天使捐款1000万,晒出汇款单

叨唠
2026-04-05 18:44:14
银行不会直说的潜规则:存款满50万,你就有资格提条件

银行不会直说的潜规则:存款满50万,你就有资格提条件

王二哥老搞笑
2026-04-03 01:16:36
潘长江挑183女婿改良基因,外孙却完美复刻姥爷

潘长江挑183女婿改良基因,外孙却完美复刻姥爷

情感大头说说
2026-04-06 11:44:48
古力娜扎:真空上阵是放飞自我还是资本博弈?

古力娜扎:真空上阵是放飞自我还是资本博弈?

娱乐领航家
2026-04-02 21:00:03
泰国白龙王一生不敢去中国,和弟子吐露:749局让他心生畏惧

泰国白龙王一生不敢去中国,和弟子吐露:749局让他心生畏惧

宅家伍菇凉
2025-02-05 17:44:30
离谱,长崎航海门将开场8秒开大脚时不慎被吴世勋直接挡入门内

离谱,长崎航海门将开场8秒开大脚时不慎被吴世勋直接挡入门内

懂球帝
2026-04-06 12:58:06
A股:大家系好安全带了,不出意外的话,明天开启新一轮调整大行情?

A股:大家系好安全带了,不出意外的话,明天开启新一轮调整大行情?

股市皆大事
2026-04-06 17:07:24
联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

原来仙女不讲理
2026-02-13 17:31:20
特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只有一个

特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只有一个

策略述
2026-04-06 18:11:39
布洛芬堆满曹操墓!这个清明节,曹操火了,现代人最懂他的需求

布洛芬堆满曹操墓!这个清明节,曹操火了,现代人最懂他的需求

魔都姐姐杂谈
2026-04-06 06:04:25
哈弗猛龙PLUS现身,外观很霸气,激光雷达+高阶智驾,配女王副驾

哈弗猛龙PLUS现身,外观很霸气,激光雷达+高阶智驾,配女王副驾

红涛说車
2026-04-05 18:46:18
形势已然大变!西方媒体集体改口:中国,无需再向世界证明什么

形势已然大变!西方媒体集体改口:中国,无需再向世界证明什么

吃货的分享
2026-04-06 19:14:12
我国最“不靠谱”的三位专家,公开在央视“忽悠”人,却爆火28年

我国最“不靠谱”的三位专家,公开在央视“忽悠”人,却爆火28年

来科点谱
2026-02-19 07:05:21
兵败如山倒!国产新能源,撕下了二线豪华品牌最后的“遮羞布”

兵败如山倒!国产新能源,撕下了二线豪华品牌最后的“遮羞布”

羽逸地之光
2026-04-06 05:44:43
“难以复制,一切都比中国慢太多、太多了”

“难以复制,一切都比中国慢太多、太多了”

观察者网
2026-04-06 16:10:13
国产顶级神剧,只可惜,央视播完就禁了

国产顶级神剧,只可惜,央视播完就禁了

独立鱼
2026-03-23 21:22:17
65岁黄宏现状:走路靠人搀扶,上了24次春晚,仍怀念舞台再没机会

65岁黄宏现状:走路靠人搀扶,上了24次春晚,仍怀念舞台再没机会

揽星河的笔记
2026-04-05 20:19:58
以色列袭击美使馆引发国际震动,特朗普沉默英法德失声

以色列袭击美使馆引发国际震动,特朗普沉默英法德失声

风雨与阳光
2026-04-06 18:12:37
毛主席儿媳邵华临终前拉着儿子的手,说了句让所有人没想到的话

毛主席儿媳邵华临终前拉着儿子的手,说了句让所有人没想到的话

历史回忆室
2026-03-15 13:26:18
2026-04-06 20:24:49
野生运营
野生运营
懂点产品,懂点AI,正在努力给平淡日子搞点新花样。
828文章数 10关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

媒体:付出不菲代价 "拯救大兵"行动仍有疑点未解开

头条要闻

媒体:付出不菲代价 "拯救大兵"行动仍有疑点未解开

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

亲子
本地
时尚
房产
公开课

亲子要闻

怀孕后有以下几种反应,妈妈们要重视,孕期也要降“甜度”

本地新闻

跟着歌声游安徽,听古村回响

AI时代,辨别真相的成本变高了

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版