网易首页 > 网易号 > 正文 申请入驻

GenAI时代,向量数据库如何走向产业深处?

0
分享至

  随着大语言模型爆发,向量数据库成为GenAI时代新宠儿。根据 DB-Engines 的数据,在过去36个月中,向量数据库一直是最受欢迎的数据库类别。

来自DB-Engines网站

  Gartner 在去年预测,向量数据库的采用率即将大幅上升,预计到 2026 年,30% 的企业将把向量数据库集成到其生成式AI模型中。

  向量数据库为什么这么受欢迎?向量数据库在GenAI时代将扮演怎样的角色?企业如何应用向量数据库?如何选择合适的向量数据库?近期ITPUB就上述问题采访了矩阵起源相关专家,一起探讨向量数据库的发展趋势和应用实践。

向量数据库将走向产业深处

  相比于去年的百模大战,今年大模型的热潮有了放缓的迹象,从拼模型参数转向了拼应用,大家对向量数据库的关注也转向了应用落地。

  向量数据库并不是一个全新的事物,向量化功能一直都是机器学习处理非结构化数据的重要技术手段,在2017年上一波AI发展的时候,也有一些向量检索应用,但是由于场景有限需求不足,并没有快速发展起来。向量数据库支持模糊搜索,能够与大语言模型结合起来做查询、检索,帮助大模型落地,挖掘数据的价值,这两年随着大模型发展而受到关注。

  矩阵起源研发VP赵晨阳认为,过去一年时间,大家对待向量数据库越来越趋于理性,更关注如何落地应用。

  如今文本、图片、音频、视频等半结构化、非结构化数据占比越来越高,且不断快速增长。在政企行业的智能化转型过程中,文档、图像和音/视频数据分析需求日益增加。然而,处理和分析大规模的文档、图像和音/视频数据面临着存储、检索和计算的挑战。

  传统数据库针对结构化数据的精确匹配进行了优化,而向量数据库,支持专门的向量索引,擅长对复杂的高维数据执行高级相似性搜索,并提供查询复杂数据所需的高性能,为政企机构提供了复杂高维数据查询分析能力。

  例如,在过去,企业一般通过ES对文档进行全文检索,现在也可以通过向量数据库模糊匹配的方式快速获取有用的信息。向量数据库也可以在极短时间内通过比较各自的向量,快速找到数据库中与给定图像在视觉上相似的所有图像。

  而在处理音视频时,通过对音视频进行向量化处理,可以实现以图搜图、以音/视频频搜音/频,结合大模型语义理解能力,还能实现自然语言搜图和音/视频。

  例如,在安防监控场景,可以通过自然语言对某个时段或者某个场景下的视频特征进行分析。在城市监控系统中,向量数据库可以实时分析摄像头捕捉的视频流,检测人群聚集、交通事故或其他异常事件。系统可以自动标记和存储这些事件,供后续分析和处理。同时,数据库可以与其他系统集成,如在警务系统提供全面的情报支持。

  赵晨阳指出,有了向量数据库,不需要像过去那样对图像、音/视频进行大量特征抽取,可以直接用向量的方式,通过大语言模型结合自然语言搜索能力进行检索和分析。向量数据库为企业处理非结构化数据提供了更加灵活有效的方法,简化了数据处理流水线,通过向量匹配的方式快速找到想要的结果,提升了企业数据利用效率,放大了数据价值。

  目前来看,向量数据库有非常广泛的应用场景,比如 RAG、图像相似性搜索、推荐引擎优化、客户体验个性化、异常检测、搜索引擎和欺诈检测等方面都有了落地应用。

专有vs多模,超融合带来更好体验

  数据库行业为应对向量化需求的增长,正在加紧“生产”向量功能,既包括独立的专有向量数据库,也包括在其他数据类型中支持向量检索的多模型数据库。

  专有的向量数据库专为GenAI、搜索和检索增强生成 (RAG) 应用程序而设计,一般拥有先进的索引和散列技术,在向量嵌入中进行存储、索引和搜索具有优势,但是在支持第三方工具和生态方面不如多模数据库。

  矩阵起源数据库负责人高斌指出,客户在落地AI应用的时候,基本都会使用向量数据库之外的一些传统数据库功能,比如精确检索的功能,以及第三方生态集成,此时,专有向量数据库不能很好满足需求,多模数据库是更好的选择。

  多模型数据库的发展相当迅速。Forrester 公司的一项新研究发现,到 2026 年,75% 的传统数据库(包括关系型数据库和 NoSQL 数据库)将在其产品中加入向量功能。

  但是多模数据库也有不同的类型,比较常见的像基于开源数据库PG支持向量检索的插件模式,赵晨阳介绍,如果需要集成难度低,快速落地向量数据库应用,这种插件模式是比较好的选择,但是长期来看可能带来较高的维护成本,因为向量数据库的算法迭代非常快,算法的迭代需要针对向量数据库内核和数据存储结构做大量优化,如果采用开源数据库+插件模式,最终性能会受限于社区插件开发的节奏。

  另一类是超融合数据库,矩阵起源MatrixOne是其中的代表。今年,MatrixOne新增了向量数据库引擎,为企业提供简单易用、低成本的向量数据库解决方案。

  高斌介绍,企业在选择向量数据库时,除了关注高可用、稳定性、扩展性等数据库通用能力,也会关注向量数据库的功能。很多时候,向量数据库需要结合关系型数据库和其他NoSQL数据库一起使用,像MatrixOne这样的超融合数据库,可以支持关系、文本、JSON、向量等多模数据处理,能够把用户多个应用统一到一个平台上,精简企业IT架构,降低使用门槛和开发、维护成本。

  未来,矩阵起源会根据技术发展和用户需求打造适合用户的超融合数据库,超融合并不是一个固定的概念,也没有严格的边界。“随着功能越多,系统复杂度会上升,我们会保证增加功能时尽量降低系统的复杂度,为客户提供简单易用、高性能、高可用的数据库。”高斌说。

小结:未来不止于向量数据库

  赵晨阳指出,从文本、图片到音视频等多模态发展,对数据处理能力提出了更高的要求。未来结合GPU、TPU等新硬件是向量数据库的发展方向。

  现在越来越多的企业想要应用AI/大模型,但是很多企业对人工智能的了解和相关技术储备存在不足,直接应用向量数据库有较高门槛,更希望有一个简单易用的端到端AI解决方案。

  算力、算法(模型)和数据是GenAI时代应用AI的三大要素,矩阵起源正致力于构建数据智能全域操作系统MatrixOS,该系统将由大规模异构算力纳管调度平台MatrixDC、超融合异构数据管理平台MatrixOne(超融合数据库)和 AI 智能体应用开发平台MatrixGenesis 三部分组成,打造链接算力、数据、知识、模型与企业应用的AI Native软件平台,简化数据和算力之间的连接和管理,提供简单易用的端到端AI解决方案。

  今年重磅推出的AI智能体应用开发平台MatrixGenesis,提供大模型运营和AI智能体开发,辅助用户标注和模型微调,结合MatrixOne向量数据库为企业提供更加灵活易用的端到端AI解决方案,帮助企业把算力、数据和应用场景结合起来更好地构建GenAI应用。

  当前,生成式AI的应用还在初级阶段,更多的价值还在等待挖掘探索,矩阵起源为企业提供了趁手的平台和工具,帮助企业更好地走进GenAI时代。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小米全国第3座青年公寓在武汉开启试运营,月租平均1099元

小米全国第3座青年公寓在武汉开启试运营,月租平均1099元

IT之家
2026-06-23 18:20:16
《一九四二》豆瓣评分从6.1上涨至8.3,冯小刚回应

《一九四二》豆瓣评分从6.1上涨至8.3,冯小刚回应

大象新闻
2026-06-23 07:13:04
刘涛去上海出差,想着好久没见孙俪,发微信约晚饭。孙俪回得很快:见面可以,只能中午,四点前必须散。

刘涛去上海出差,想着好久没见孙俪,发微信约晚饭。孙俪回得很快:见面可以,只能中午,四点前必须散。

时尚的弄潮
2026-06-21 11:33:43
看完阿根廷2-0奥地利!不得不承认的5个事实,梅西心魔已破除!

看完阿根廷2-0奥地利!不得不承认的5个事实,梅西心魔已破除!

楠楠自语
2026-06-23 10:15:46
SPACEX股价抹去早前跌幅,转为上涨

SPACEX股价抹去早前跌幅,转为上涨

每日经济新闻
2026-06-23 19:29:04
卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

叨唠
2026-05-27 04:13:37
死刑犯临刑前三停五口喝水,总指挥:暂停行刑,这是19年前的暗号

死刑犯临刑前三停五口喝水,总指挥:暂停行刑,这是19年前的暗号

星宇共鸣
2026-05-18 13:21:51
80后的离婚率真的太吓人了!

80后的离婚率真的太吓人了!

微微热评
2026-06-22 05:58:58
所谓的爱情本质是肉体吸引,跟精神或者灵魂没有半点关系

所谓的爱情本质是肉体吸引,跟精神或者灵魂没有半点关系

加油丁小文
2026-06-07 11:00:11
美媒警告:中方必须遵从美国领导,并且只能在美国设定界限内发展

美媒警告:中方必须遵从美国领导,并且只能在美国设定界限内发展

梦史
2026-06-14 19:31:39
数百名医生已证实:维生素B12的真相,最好花点时间看看

数百名医生已证实:维生素B12的真相,最好花点时间看看

岐黄传人孙大夫
2026-06-19 18:45:03
受贿1.39亿余元,上海市委原常委朱芝松一审被判死缓

受贿1.39亿余元,上海市委原常委朱芝松一审被判死缓

政知新媒体
2026-06-23 18:23:59
今夜,43家A股公司提示风险!13倍大牛股在列

今夜,43家A股公司提示风险!13倍大牛股在列

每日经济新闻
2026-06-24 00:06:07
广东近两日最高气温直逼37℃!台风“米克拉”无直接影响

广东近两日最高气温直逼37℃!台风“米克拉”无直接影响

南方都市报
2026-06-23 16:38:09
中国外交官已撤离!比美国还嚣张的国家,不许统一,如今认错求和

中国外交官已撤离!比美国还嚣张的国家,不许统一,如今认错求和

风信子的花
2026-06-23 10:50:49
川普这回真雄起了?

川普这回真雄起了?

西楼饮月
2026-06-23 23:49:37
世界杯首支亚洲球队出局:1-2被逆转,2连败0分垫底,仍比国足强

世界杯首支亚洲球队出局:1-2被逆转,2连败0分垫底,仍比国足强

侃球熊弟
2026-06-23 13:02:02
143分钟鏖战!郑钦文温网热身赛告捷:KO资格赛选手,排名升15位

143分钟鏖战!郑钦文温网热身赛告捷:KO资格赛选手,排名升15位

刘姚尧的文字城堡
2026-06-23 07:57:22
湖北一富豪当街殴打迈巴赫车主,知情人称:那是他女儿,打死活该

湖北一富豪当街殴打迈巴赫车主,知情人称:那是他女儿,打死活该

黑猫故事所
2025-04-14 18:45:09
贝克汉姆赢麻了!没踢世界杯却狂赚近2千万镑,身家翻倍破百亿

贝克汉姆赢麻了!没踢世界杯却狂赚近2千万镑,身家翻倍破百亿

情感大头说说
2026-06-23 15:22:45
2026-06-24 02:19:00
ITPUB学院
ITPUB学院
分享技术干货,了解最新动态
1239文章数 629关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

"纸尿裤风波"第一爆料人:如果我错了 坐牢都接受

头条要闻

"纸尿裤风波"第一爆料人:如果我错了 坐牢都接受

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

AI“算力稀缺”信仰开始动摇?

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

健康
手机
亲子
房产
教育

同样是中风,急救方向竟完全相反?

手机要闻

报告预测苹果首款折叠屏iPhone上市一年后或贬值近1300美元

亲子要闻

炮哥的媳妇怀二胎长胖了20斤,炮哥却担心没人带,听听他怎么说

房产要闻

洞察新局|预算不变 居住升级 2026广州置业成本观察

教育要闻

2026四川高考成绩25日18:30公布!附查询入口→

无障碍浏览 进入关怀版