网易首页 > 网易号 > 正文 申请入驻

AI 原生向量数据库 : 大模型的“黄金搭档”, 能提供“记忆海绵”

0
分享至

本文首发微信公众号:飞总聊IT

向量数据库,顾名思义,是用来存储和查询向量数据的数据库。这本来是一个相对小众的数据库产品,主要服务于人工智能和信息检索领域,但是伴随大模型的流行,越来越重要了。

要理解向量数据库,首先要理解什么是向量。这就要回到微积分和线性代数了。在向量数据库里,一个向量数据,就是一个以原点为起点,n-维度空间任意一个点为终点的向量,我们通常记录其终点,用一个大小为n的数组来表达。

向量数据库里面存储了很多的向量数据。其最常用的检索功能是给定一个输入的向量,找出Top-k个距离最近的向量。

那么,向量数据库为什么和机器学习,大模型相关呢?

我们知道,目前的大语言模型主要基于深度学习技术。深度学习的输入可以是文本,图片,视频等语料。这些数据被神经网络真正作为输入使用之前,需要经过一个从语料到向量的转化过程。神经网络真正使用的输入是向量,这个过程叫做embedding。

举例来说,如果输入是一篇pdf,我们通常要先对pdf的文本进行分段(segment),然后对每一段的文字进行embedding,最后得到的若干个向量,会被存入向量数据库被后续的训练等场景使用。如下图所示:

向量数据库的应用很多,在大模型兴起之前,向量数据库最成功的应用是搜索引擎。谷歌和微软的必应搜索引擎都应用了向量数据库来帮助搜索。

具体来说,用户在搜索框中输入问题,问题被embedding成一个向量。向量数据库里面则存了各种网页经过embedding以后的向量。

系统只需要对输入的向量进行top-k查询,这最近的k个向量对应的文字,就是需要返回的搜索结果。通过embedding操作,可以把语义的相关性问题,转化成为n维空间向量之间的最近距离的问题。

针对不同的数据,比如文本,图片,视频,等进行embedding以后,向量数据库可以做的操作非常的多,下图展示了一些向量数据库能做的事情:

在大模型时代,训练大模型和使用大模型,是很多企业都想做的事情。

通常来说,大模型使用有三种方式:自己训练,基于现有模型微调,或者直接用。

对自己训练和基于现有模型微调两种使用方式的训练阶段,使用向量数据库的主要目的是提高对训练数据的分类,去重和清洗的效率。

而在大模型的推理阶段,向量数据库的作用就更大,主要有三个作用。

首先,大模型的训练语料有截止日期,比如说GPT系列的数据库到2021年9月。但是在推理阶段,大模型需要根据最新的数据来回答问题。

此外,每个企业都有自己内部独有的知识库,这些知识库,在大模型的预训练和finetune阶段可能也没有被大模型学习过,需要额外提供给大模型。

向量数据库可以成为一个知识库的作用,给大模型提供最新的数据,和每个客户企业独有的内部知识库。下图展示了这种场景下向量数据库的作用。

其次,大模型有token数限制。一旦超过了最大的Token数,大模型就开始忘记上下文。向量数据库可以记录客户端和大模型之间的对话聊天信息,为大模型提供理论上没有上限的长期记忆。这就解决了大语言模型对Token数的限制,避免上下文信息丢失的问题了。下图展示了这种场景下向量数据库的作用。

最后,向量数据库还可以为大语言模型提供缓存。系统可以先在缓存中搜索相似的问题和对应的答案,如果缓存命中的话,就不可以直接返回结果。这可以减少对大模型调用的开销,提高服务响应速度。下图展示了这种应用场景。

2023年7月4日,腾讯云正式发布AI 原生(AI Native)向量数据库 Tencent Cloud VectorDB。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

下图展示了AI 原生向量数据库 Tencent Cloud VectorDB 的架构。

据介绍,腾讯云AI 原生向量数据库Tencent Cloud VectorDB 最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。

值得关注的是,腾讯云重新定义了AI Native的开发范式,提供了接入层、计算层、存储层的全面AI化解决方案,使用户在使用向量数据库的全生命周期,都能应用到AI能力。

具体而言,在接入层,腾讯云向量数据库支持自然语言文本的输入,同时采用“标量+向量”的查询方式,支持全内存索引,最高支持每秒百万的查询量(QPS);在计算层,AI Native开发范式能实现全量数据AI计算,一站式解决企业在搭建私域知识库时的文本切分(segment)、向量化(embedding)等难题;在存储层,腾讯云向量数据库支持数据智能存储分布,助力企业存储成本降低50%。

据了解,腾讯云向量数据库的向量化能力(embedding)曾多次获得权威机构认可,2021年曾登顶MS MARCO榜单第一、相关成果已发表于EMNLP顶会ACL。

由于大模型的训练数据,无法突破时间和空间的维度限制,用好大模型,就必然需要一个外部知识库。在当前的技术选型中,向量数据库是最成熟和有效的外部知识库解决方案。

再加上大模型本身有token数的限制,调用大模型耗时久,费用高,而向量数据库能通过给大模型提供长期记忆,以及作为大模型缓存的功能,同时解决了这些问题。

所以大模型加向量数据库的系统架构,也必然会伴随着大模型的流行而普及开来。而腾讯云AI 原生向量数据库Tencent Cloud VectorDB这款产品,经过腾讯的内部技术沉淀,经过了腾讯海量业务场景的验证,无疑大模型的“黄金搭档”。

统计显示,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现10倍效率的提升,如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2—4个数量级。

伴随着大模型相关应用的迅速发展和落地,AI Native向量数据库也会成为企业数据处理的标配,腾讯云AI 原生向量数据库Tencent Cloud VectorDB这款产品也必然受到客户青睐。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视巨作被疯狂举报,只因这点,恨国党炸锅了!

央视巨作被疯狂举报,只因这点,恨国党炸锅了!

毛豆论道
2026-02-14 21:55:16
慕安会结束,王毅离开现场,日本对华提出抗议,沙利文措辞不寻常

慕安会结束,王毅离开现场,日本对华提出抗议,沙利文措辞不寻常

东极妙严
2026-02-16 09:40:49
拿600万年薪还叛变华为,效忠美爹:偷来的芯片终成资本“冥币”

拿600万年薪还叛变华为,效忠美爹:偷来的芯片终成资本“冥币”

李砍柴
2025-08-28 18:58:47
除夕撒狗粮!杨瀚森C位晒与女友甜蜜合影 总结首次NBA全明星之旅

除夕撒狗粮!杨瀚森C位晒与女友甜蜜合影 总结首次NBA全明星之旅

醉卧浮生
2026-02-16 13:25:43
江苏8死2伤烟花爆燃1分钟视频流出:大量隐情披露,责任人被控制

江苏8死2伤烟花爆燃1分钟视频流出:大量隐情披露,责任人被控制

博士观察
2026-02-16 13:20:56
8岁女孩拿到6张奖状在母亲坟前哭诉“没有意义你看不到”,40岁姑姑安慰“我奖励你”,涡阳县民政:正核实跟进

8岁女孩拿到6张奖状在母亲坟前哭诉“没有意义你看不到”,40岁姑姑安慰“我奖励你”,涡阳县民政:正核实跟进

极目新闻
2026-02-15 21:02:32
郑钦文赛前两小时退赛,医生说再打可能撕裂肌腱,她扛住了什么?

郑钦文赛前两小时退赛,医生说再打可能撕裂肌腱,她扛住了什么?

林子说事
2026-02-16 14:14:10
“你滑下来再庆祝啊” 27岁中国选手提前庆祝致滑倒 遗憾无缘决赛

“你滑下来再庆祝啊” 27岁中国选手提前庆祝致滑倒 遗憾无缘决赛

风过乡
2026-02-16 07:12:52
金正恩出席新星大街竣工典礼 海外作战军人遗属将入住

金正恩出席新星大街竣工典礼 海外作战军人遗属将入住

环球网资讯
2026-02-16 15:31:45
微信可以发金色朋友圈了,腾讯公关总监亲自下场示范

微信可以发金色朋友圈了,腾讯公关总监亲自下场示范

界面新闻
2026-02-16 11:36:09
45个节目只剩5个语言类,这届春晚为何不善言辞?

45个节目只剩5个语言类,这届春晚为何不善言辞?

木蹊说
2026-02-15 23:06:09
除夕彩蛋:刚刚杭州这里飘雪啦

除夕彩蛋:刚刚杭州这里飘雪啦

都市快报橙柿互动
2026-02-16 17:08:37
你在学校出名的原因有多离谱?网友:凭一己之力,拆散了所有情侣

你在学校出名的原因有多离谱?网友:凭一己之力,拆散了所有情侣

带你感受人间冷暖
2026-02-14 22:36:19
男子花80块钱请人画画,付款时,要了张收据,50年后,这张收据卖了180万

男子花80块钱请人画画,付款时,要了张收据,50年后,这张收据卖了180万

霹雳炮
2026-02-14 20:47:47
贾樟柯用Seedance 2.0做了一部短片,生成了2个“贾樟柯”:我并不担心技术会不会“取代”电影

贾樟柯用Seedance 2.0做了一部短片,生成了2个“贾樟柯”:我并不担心技术会不会“取代”电影

都市快报橙柿互动
2026-02-16 13:56:51
中门对狙?中方刚给30天免签,英加却要对等不了了!

中门对狙?中方刚给30天免签,英加却要对等不了了!

达文西看世界
2026-02-16 12:58:03
就为道那声“过年好”

就为道那声“过年好”

北青深一度
2026-02-16 11:06:41
你最爽的经历是什么?网友:约过一个比我大好几岁的姐姐

你最爽的经历是什么?网友:约过一个比我大好几岁的姐姐

带你感受人间冷暖
2026-02-16 01:10:39
黑龙江一男子捡到苹果手机,刷机送给外甥女使用,失主坚持不懈寻找2年追回:重要资料已被删,共赔偿8500元

黑龙江一男子捡到苹果手机,刷机送给外甥女使用,失主坚持不懈寻找2年追回:重要资料已被删,共赔偿8500元

大象新闻
2026-02-16 13:43:04
突发!集体崩盘,资金连夜出逃…

突发!集体崩盘,资金连夜出逃…

魏家东
2026-02-16 11:13:49
2026-02-16 17:47:00
飞总聊IT incentive-icons
飞总聊IT
互联网技术与商业分析
2540文章数 15386关注度
往期回顾 全部

科技要闻

OpenAI拿下OpenClaw之父 承诺开源绝不动摇

头条要闻

66岁台大教授苑举正首次回山东老家过年:零下5℃冷啊

头条要闻

66岁台大教授苑举正首次回山东老家过年:零下5℃冷啊

体育要闻

遭针对?谷爱凌炮轰国际雪联安排

娱乐要闻

好甜蜜!郭富城随方媛回安徽过年

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

数码
家居
亲子
教育
公开课

数码要闻

苹果将推多款智能家居产品 包含AI家庭中心与摄像头

家居要闻

中古雅韵 乐韵伴日常

亲子要闻

白百何因孩子一泡尿上热搜?网友炸锅:别对带娃妈妈太苛刻!

教育要闻

中国境外留学泡沫破裂!下一轮教育通胀是中外合作办学吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版