AI时代,真是啥都要快。
三行代码构建一个AI应用,现在就这样被蚂蚁OceanBase游刃有余地实现了。
![]()
熟悉数据库的朋友都知道,OceanBase是蚂蚁集团于2010年发布的一款全自研的国产企业级分布式关系数据库。
历经15年迭代升级,如今它不仅在权威测评中稳居国产数据库第一梯队,其稳定性更是经过了“双十一”等高并发场景的持续验证。
悄悄补充一句,OceanBase还在现场秀出了最新成绩单——全球客户数已突破4000家,连续五年年均增速超100%,服务覆盖16个国家和地区、60多个地域、240多个可用区。
而且截至今年5月,经过四年开源实践,OceanBase已形成拥有超过25000名开发者的活跃社区,累计下载量突破百万。
![]()
但随着AI时代的到来,OceanBase也迎来了新的考验:
- AI时代需要怎样的数据库?OceanBase如何继续保持领先?
一切答案,都藏在刚刚落幕的2025 OceanBase年度发布会上了——
这一次,他们不是用语言,而是用实打实的产品给出最新思考。
面向AI时代的原生混合搜索数据库
具体而言,OceanBase发布并开源了其首款AI数据库——OceanBase seekdb(简称seekdb)。
发布会上的介绍是酱婶儿的:
- 开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。
![]()
MIT的一项研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。
而seekdb正是在这些痛点上下文章:
过去在做交易和分析时,行业主要关注数据库中的查询以及数据分析等功能,但在AI应用场景下,除了交易和分析功能外,更需要对不同类型和模块的数据进行混合检索和综合利用。
在OceanBase CTO杨传辉看来,这是与传统最大的区别,也是当前行业普遍面临的挑战。换言之:
- 混合搜索,正在成为AI原生数据库的“分水岭”。
于是,他们就为seekdb配备了AI原生混合搜索能力。
它支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID一致性,并兼容MySQL生态。
此外,seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。
![]()
而针对落地难的问题,seekdb也支持极简部署,开箱即用。
据介绍,seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。
这就好比将一套企业级数据库的复杂度,降低到了像使用一个普通Python库一样简单,从而让开发者能专注于AI应用逻辑本身,而非底层基础设施的运维。
![]()
最后,OceanBase这次还把seekdb给开源了。
采用开发者友好的Apache 2.0协议,用户可自由使用、修改和扩展。
而且产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态;并提供SQL及PythonSDK,适配不同开发习惯。
![]()
整体而言,在OceanBase CEO杨冰看来,AI的真正瓶颈不在模型,而在数据。
尤其在金融、政务等高敏场景,AI需在毫秒级完成实时推理,并安全融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与延迟风险。他表示:
- seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库
- 它继承OceanBase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。
而且,作为OceanBase“Data×AI”战略的关键一环,seekdb既可独立使用,也可融入新发布的OceanBase 4.4一体化融合版本。
![]()
该版本首次将TP(联机事务处理)、AP(联机分析处理)与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,以帮助企业避免后期架构重构。
据悉其商用LTS版本将于2026年2月2日推出。
还开源了这些
与此同时,OceanBase还开源了一系列工具。它们与seekdb一起,构成了OceanBase面向AI应用的完整工具链,覆盖数据管理、检索、解析、记忆等关键环节。
智能文档解析框架PowerRAG:
PowerRAG是OceanBase基于其“混合搜索”能力打造的、源自蚂蚁内部实践的企业级RAG(检索增强生成)解决方案。
一旦开发者需要构建一个企业知识库、智能客服等AI应用,直接用PowerRAG,就可以省去自己组合多种工具(向量数据库+全文搜索引擎+关系数据库)、并反复调优以达到生产标准的繁琐过程。
![]()
分层记忆架构PowerMem:
PowerMem核心解决,如何让大模型更高效、更智能地记住和管理与用户互动的上下文信息。
它充当了一个外部的、可无限扩展的“记忆仓库”,帮助AI应用(尤其是智能体Agent)存储、检索和利用海量的历史对话、用户偏好、知识片段等上下文信息。
在记忆体领域的权威评测基准LoCoMo Benchmark上,它以73.70分登顶SOTA,Token消耗降低96%,大幅节省了推理成本。
![]()
至此,通过以上这些开源发布,面对“AI时代我们需要怎样的数据架构”这一问题,OceanBase给出的答案也很清晰了——
即通过“多负载+多模+混合多云”实现数据统一,并通过“弹性底座+原生多租户/混合搜索”实现智能与效率。
换句话说,OceanBase正在用一套覆盖多负载、多模态、混合多云的统一数据底座,把企业里分散在不同系统、不同格式、不同云环境中的数据重新“拉”回一张桌子上;再用弹性底座、原生多租户(单集群多业务隔离)与混合搜索,让这些数据既能被安全管理,又能被AI实时高效地调用。
![]()
这意味着,AI时代的企业不必再为一个应用拼几十个系统,而是只需要一个能同时处理交易、分析、搜索与AI推理的统一数据库内核。就像大会过程中提到的那样:
- 想开发AI应用,现在只需一个数据库了。
以及动手能力强的童鞋现在就能试试,用三行代码手搓一个AI应用(doge)。
seekdb开源地址:
https://github.com/oceanbase/seekdb
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.