网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

进化Dify！还支持MCP，这款开源AI数据库绝了～【附喂饭级教程】

2025-12-02 08:34:35　来源: 袋鼠帝

云南举报

0

分享至

大家好，我是袋鼠帝。

最近我在折腾本地AI知识库的时候，在Github发现了一个特别有意思的新项目，叫seekdb。

它是一款开源的AI原生混合搜索数据库。

https://github.com/oceanbase/seekdb

seekdb的配置要求，低到离谱，最低只需要1核CPU，2GB内存，就能跑起来。

它是All In One的AI原生数据库，一个库包圆了向量、文本、结构化/半结构化数据。

PS：也就是既可以做向量数据库（实现RAG），又能存储业务数据（传统关系型数据库）非常全能～

还支持 MySQL协议，Navicat直接连（Navicat是一款非常经典的数据库可视化管理工具）

还能当MCP Server用，可以接入Trae、Claude Code、Cursor等任何支持MCP的工具或平台。

另外，还可以接入Dify，不是当作外部知识库接入哦，是可以直接掌管Dify的元数据和AI知识库，因为Dify官方的最新版本在底层对它做了兼容。

当下大多数团队在真正落地Agentic RAG应用的时候，或多或少应该都会遇到一个问题：底层数据架构过于复杂。

为了让检索足够精准，通常需要处理三种完全不同的数据形态：

一是业务元数据，比如Agent的创建时间、作者、权限，工作流的各种节点数据。这需要关系型数据库来存，因为它要求绝对的事务安全。

二是语义向量，这是把文字变成数学向量，让AI能理解语义。这需要向量数据库来存。

三是全文检索，也就是关键词匹配，因为有时候向量搜索会想太多、或者理解有偏差，反而搜不到一些具体的专有名词，这时候就需要传统的全文检索来兜底。

在过去，为了实现这三者的混合搜索（Hybrid Search），不得不采用一种拼图式的分布式架构：比如装一个MySQL或PostgreSQL存元数据，再装一个Milvus或Chroma存向量，为了搜得准，甚至还得再挂一个Elasticsearch做全文检索。

你得维护三套完全不同的成熟系统，还要自己处理它们之间的数据同步。最要命的是，这种跨系统的写入，很难保证事务一致性。比如网络一抖动，向量库写入失败了，但元数据写入成功了，你的知识库就精分了，一边告诉你文档在，一边又搜不到内容。

系统越复杂，人力投入就越大，风险越高..

但seekdb的思路非常清晰，就做减法：把向量、文本、结构化/半结构化数据，全部塞进了一个数据库里。

这意味着，你不需要再去维护那一堆乱七八糟的中间件了

一个seekdb，全搞定。

它的核心能力也是混合搜索。

seekdb直接在数据库内核层面，支持了向量、全文和标量过滤的混合查询。一条SQL语句，就能完成多路召回和精排。

它还内置了AI函数：

你可以在数据库里，直接调用大模型或者向量模型，完成数据的嵌入和推理。

这就是，AI原生数据库，自己带了个脑子

这是seekdb和其他开源数据库的对比

我觉得，这玩意儿特别适合几个场景：

一个是个人或者小团队的本地知识库。因为它轻量，资源占用少，随便找台旧电脑或者便宜的云服务器就能跑。

另一个是边缘设备上的AI应用。比如手机，车机，或者工业网关，这些设备的资源有限，跑不动那些重型数据库，但seekdb这种轻量级架构，正好能派上用场。

当然，还有就是作为Agent的记忆体。它能同时存储结构化的对话记录和非结构化的向量记忆，非常适合用来给AI Agent做长期记忆。

好了，话不多说，我们直接上实操！

本地部署seekdb（超简单）

部署seekdb，简单得让我有点不适应。

如果你习惯用Python，直接pip安装就行。

pip install pyseekdb

如果你想用Docker，也是一行命令的事。

docker run -d --name seekdb -p 2881:2881 oceanbase/seekdb:latest

启动速度非常快，几乎是秒级。

安装好之后，你可以用Python SDK来操作，也可以直接用MySQL客户端（比如Navicat）连接。

也可以接入Dify使用

Dify虽然好用，但它的开源版在做AI知识库这块，检索效果确实有点差强人意。

而且Dify的默认元数据库（PostgreSQL）和向量数据库（Weaviate）是分开的，相比seekdb有以下不足：

seekdb通过粗排 + 精排机制，能保持毫秒级响应，支持百亿级向量检索。

现在最新的Difyv1.10.1正式兼容了MySQL数据库

这意味着我们可以把Dify的元数据库（存储业务数据）和向量数据库，都切换成seekdb（因为它支持MySQL协议）。

看能不能提升一下Dify的知识库效果

需要做两个地方的改动：

一个是在Dify的docker/docker-compose.yaml文件里，把api、worker、worker_beat、web服务的image版本号改为1.10.1，或main

比如langgenius/dify-api:1.10.1

或者langgenius/dify-api:main

第二个改动是把dify/docker下的.env.example 复制出来，改名为.env

不过在文件夹里面，这两个文件都是隐藏文件，正常是看不到的。

Mac查看隐藏文件的快捷键 command+shift+.

Windows快捷键是ctrl+shift+h

在.env里面修改几个配置

如果既作为元数据库又是向量数据库的话，修改以下配置

COMPOSE_PROFILES=seekdb

如果仅作为元数据库，只需要改下面这些：

COMPOSE_PROFILES=${VECTOR_STORE:-weaviate},seekdb

如果仅作为向量数据库（只替换知识库功能），只改下面这些配置：

COMPOSE_PROFILES=seekdb,${DB_TYPE:-postgresql}

启动之后，dify会帮seekdb设置一个默认密码：difyai123456

PS：这个密码也可以在.env文件里面修改

做完上面这些之后，执行docker-compose up -d重新拉取新镜像，同时也会自动重启服务。

启动之后，seekdb就会同时扮演元数据库、向量数据库和全文检索系统的角色

然后我把最近在公众号发布的一些文章通过Dify打造了一个知识库

在seekdb里面找到vector_index开头的表，可以看到，已经有对应的向量数据存储进来了。

接入GLM-4.6做了一些知识库搜索的测试，感觉效果还是不错的：

作为MCP-Server接入本地Agent

seekdb还提供了MCP-Server。

我们可以把它接入本地的Trae、Cursor、Claude Code等工具，作为一个本地Agent的知识库工具，给Agent补充一些私有的专业知识，或者让它记住你的偏好。

接入步骤也很简单，分为两步，不过需要先满足以下前置条件：

1.已经在本地部署seekdb；

2.本地Python版本在3.11或以上；

3.需要安装Python包管理器uv：pip install uv，安装完成后执行uv --version验证是否安装成功。

然后第一步：安装OceanBase MCP Server

1.克隆项目到本地（也可以去Github下载zip包）：

git clone https://github.com/oceanbase/mcp-oceanbase.git

2.进入源代码目录：

cd mcp-oceanbase

3.安装依赖：

uv pip install

第二步：接入本地Agent，比如Trae

在Trae里面配置seekdb的MCP-Server

"mcpServers": {

"oceanbase": {

"command": "uv",

"args": [

"--directory",

"/path/to/your/mcp-oceanbase/src/oceanbase_mcp_server",

"run",

"oceanbase_mcp_server"

],

"env": {

"OB_HOST": "127.0.0.1",

"OB_PORT": "2881",

"OB_USER": "root",

"OB_PASSWORD": "difyai123456",

"OB_DATABASE": "test"

注意：路径替换成自己的oceanbase_mcp_server绝对路径

第一次启动的时候，会下载MySQL相关驱动，有点慢。

成功后，如下图，有10个工具

1. execute_sql：在 OceanBase 服务器上执行任意 SQL 语句。

2. get_ob_ash_report：生成 OceanBase 的 ASH（活跃会话历史）报告，用于性能分析，可指定起止时间和租户。

3. get_current_time：获取 OceanBase 的当前系统时间。

4. get_current_tenant：获取当前连接会话所属的 tenant（租户）名称。

5. get_all_server_nodes：列出 OceanBase 集群中所有 server 节点（需要 sys 租户权限）。

6. get_resource_capacity：获取集群资源（CPU/内存等）容量信息（需要 sys 租户权限）。

7. search_oceanbase_document：基于关键字从 OceanBase 官方文档里自动检索相关内容，为 LLM 提供上下文知识。

8. oceanbase_text_search：在 OceanBase 表里做全文检索，可指定文本列、搜索词、WHERE 条件和返回列。

9. oceabase_vector_search：对表中的向量列执行向量相似度搜索，可指定距离算法、是否返回距离、TopK 等。

10. oceanbase_hybrid_search：同时结合「结构化过滤（如年龄>20）」和「向量相似度」进行多模态混合搜索。

OceanBase MCP的使用方式还是有挺多的，我给大家展示两种：

一种是传统数据库的增删改查：

另外一种是混合检索（全文检索+语义检索）。

不过AI并不清楚混合检索的sql语句，所以需要给上下文（也就是sql示例，我这里写在了输入框，后续可以放到Trae的规则，或者作为一个文件，放在当前文件夹下）

sql示例可以在seekdb官方文档找到：

https://www.oceanbase.ai/docs/zh-CN/

向量表的表名也得给对（可以去navicat里面找vector_index开头的）

这里的提问：搜索一下PaddleOCR-VL是什么

这样AI就能通过OceanBase MCP进行语义搜索，找到我通过Dify向量化存储到seekdb的PaddleOCR-VL文章的相关信息，并整理回答。

更多信息可以在seekdb官方文档里面查看：

https://www.oceanbase.ai/docs/zh-CN/

我感觉，数据库这个行业，终于也开始被AI重塑了。

过去，我们为了适应数据库，不得不把数据拆开，去适应不同的存储引擎。

现在，seekdb把向量、文本、结构化数据重新融合在了一起，用一种更符合AI的使用方式，来存储和检索数据。

而且能无缝兼容MySQL协议，意味着很容易迁移/切换

我查了一下seekdb，还是蚂蚁旗下的OceanBase团队开源的项目

如果你正在为AI项目的数据架构头疼，或者只是想在本地快速搭个好用的知识库，可以去试试这款全新的AI数据库--seekdb

能看到这里的都是凤毛麟角的存在！

如果觉得不错，随手点个赞、在看、转发三连吧~

如果想第一时间收到推送，也可以给我个星标⭐

谢谢你耐心看完我的文章~

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

轻量高效，即插即用：Video-RAG为长视频理解带来新范式

机器之心Pro 2025-10-20 18:23:17
0 跟贴 0
再斩第一！OceanBase蝉联IDC榜单，国产数据库实力领跑

雷科技 2026-01-07 21:56:36
0 跟贴 0

AI时代，重做ERP

钛媒体APP 2025-10-13 10:30:10
7 跟贴 7

当AI已成为共识，企业究竟该如何真正“用起来”？

吴晓波频道 2026-01-07 08:33:41
0 跟贴 0
强！武汉学院学子在这项AI全国总决赛中斩获1.2万奖金！

小e教育 2026-01-07 17:12:04
0 跟贴 0

3周策划20分钟诱导，乌军如何抢夺苏35雷达并渗透其数据库的？

爱屋鸳鸯 2026-01-04 17:42:39
738 跟贴 738

HR逼我30分钟内离职,我默默格式化测试服务器,项目上线在即她慌了

朴挽凉 2026-01-05 07:52:29
0 跟贴 0
高志凯美国把AI数据库建在防空洞里，而中国没有任何防护！

听成世界酷 2026-01-06 03:09:32
85 跟贴 85

歼-35开启新年第一飞媒体揭秘试飞机为何是"绿皮机"

央视新闻 2026-01-08 09:21:10
6236 跟贴 6236
「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式

机器之心Pro 2026-01-08 17:51:14
0 跟贴 0
大模型最难的AI Infra，用Vibe Coding搞定

机器之心Pro 2026-01-07 15:33:06
0 跟贴 0
独家｜ChatExcel 一年完成三轮融资，考拉基金、合鼎共资本参与投资

钛媒体APP 2026-01-08 09:09:15
0 跟贴 0
AI需要破壁人

虎嗅APP 2025-12-27 21:33:05
0 跟贴 0
当算力不再是AI“进化”的唯一瓶颈：知名材料公司康宁的中国光通信生意

经济观察报 2026-01-08 15:37:40
1 跟贴 1
大数据算法为什么要这样设置

小猫上树 2026-01-06 13:49:34
1 跟贴 1
DeepSeek突然更新R1论文：暴增64页，能公开的全公开了

DeepTech深科技 2026-01-08 17:10:32
4 跟贴 4
微信辟谣网传新规则

界面新闻 2026-01-08 14:53:45
1548 跟贴 1548
模型不用微调，靠上下文就能自我进化？

机器之心Pro 2025-10-11 20:20:59
0 跟贴 0
穗碳云平台上线，全国首个超大城市全域电碳数据库在穗发布

广州市科协 2026-01-08 22:25:51
0 跟贴 0
阿里：加大投入淘宝闪购以达到市场绝对第一

第一财经资讯 2026-01-08 13:44:51
962 跟贴 962
《复兴文库》数据库发布上线

新华社 2026-01-07 09:21:10
0 跟贴 0
AI云的“半程路标”：谷歌云和阿里云的逆袭，AWS、微软云的再审视

钛媒体APP 2025-12-18 16:17:10
0 跟贴 0
拒绝智能手机，炮轰ChatGPT，没有他就没有今天的互联网

DeepTech深科技 2025-12-26 18:07:26
0 跟贴 0
即使没有脑，水母也会像人类一样睡眠

原理 2026-01-08 21:40:46
0 跟贴 0
开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

量子位 2026-01-08 19:01:00
0 跟贴 0
河南三兄弟连续11年给家乡老人发放救助金，村支书：每人每月发300元到1000元，累计发了600多万元，有老人已经领了七八万元

极目新闻 2026-01-07 21:22:09
2097 跟贴 2097
乐高往积木里塞了个电脑，这是半世纪以来最大的一次进化｜CES 2026

爱范儿 2026-01-08 18:06:01
2 跟贴 2
馋了二十年没吃上的烤鸭店，今天终于被算法推荐带去了却心愿

午餐肉艺术家葛世贤 2026-01-07 00:00:00
0 跟贴 0
宇宙有一本隐藏的设计图所有生物都在照抄！

湘妹看世界 2026-01-08 09:30:30
1 跟贴 1
商业进化的下一站：从内容空间，到安放时间

虎嗅APP 2026-01-08 17:23:05
1 跟贴 1
AI 生态重构正当时，联通云如何以“算网一体”撬动国产智算新局？

通信世界 2025-12-03 10:14:08
0 跟贴 0
“活人感”智能座舱原来如此丝滑！阶跃星辰端到端语音模型海外“出圈”

上观新闻 2026-01-08 16:40:04
0 跟贴 0
AI研发本质是一场与生物进化同构的试错游戏

量子位 2025-12-12 04:34:17
0 跟贴 0
全域AI 2.0、Eva、G-ASD，吉利在CES展示了何种进化路径？

买车君 2026-01-07 18:18:25
0 跟贴 0
上海男篮又要破纪录了？

新民晚报 2026-01-08 10:10:34
432 跟贴 432
老板娘以为是自己算错账，结果手机和计算器各自有不同算法

锐眼新闻 2026-01-06 13:54:14
25 跟贴 25
充电速度快到可视化，电量肉眼可见上涨，这速度能当暖风用了！

釦跑酷时尚 2026-01-05 08:55:06
4 跟贴 4
中到大雪局部暴雪！山东迎强冷空气，最低温-10℃，9级大风+降温组团来袭

齐鲁壹点 2026-01-08 16:23:17
81 跟贴 81
黄鹤楼景区应修北门？建议来了

极目新闻 2026-01-06 10:23:04
818 跟贴 818
虽然避免不了出事，但我们总能找到责任人

槽逻辑 2026-01-08 09:05:01
30 跟贴 30

出差前我把家里地暖关了，当晚楼下阿姨在群里开骂…

出差前我把家里地暖关了，当晚楼下阿姨在群里开骂…

极品小牛肉

2026-01-05 14:43:53

昆山一外企电子大厂突发解散：300多名员工获N+1补偿金和购物卡

昆山一外企电子大厂突发解散：300多名员工获N+1补偿金和购物卡

六子吃凉粉

2026-01-08 12:34:04

演员王传君发文宣布退出

In风尚

2026-01-07 19:16:24

突发！芯片三巨头集体“撤离”，中国厂商：这泼天的富贵必须抓住

突发！芯片三巨头集体“撤离”，中国厂商：这泼天的富贵必须抓住

科普100克克

2026-01-08 10:09:45

闫学晶风波再升级！称自己的钱够花几辈子，凭本事吃饭，爱咋咋地

闫学晶风波再升级！称自己的钱够花几辈子，凭本事吃饭，爱咋咋地

小徐讲八卦

2026-01-08 10:34:47

原形毕露？中国女篮第一人全场最差，拖累球队连输两场倒数太尴尬

原形毕露？中国女篮第一人全场最差，拖累球队连输两场倒数太尴尬

宗介说体育

2026-01-08 12:52:51

美国衰落，就是一个巨大的谎言

枫冷慕诗

2026-01-06 12:28:30

瑟瑟发抖！不到24小时，日本失去动武资格，中国再宣布对日新制裁

瑟瑟发抖！不到24小时，日本失去动武资格，中国再宣布对日新制裁

离离言几许

2026-01-07 22:38:54

1-0绝杀！2-0爆冷！U23亚洲太疯狂：CCTV5调整直播，中伊大战打响

1-0绝杀！2-0爆冷！U23亚洲太疯狂：CCTV5调整直播，中伊大战打响

二疯说球

2026-01-08 09:20:50

中国母女2人在老挝遇害身亡，嫌疑人曾在被害女子丈夫手下工作，母亲奔逃呼救画面被拍下

中国母女2人在老挝遇害身亡，嫌疑人曾在被害女子丈夫手下工作，母亲奔逃呼救画面被拍下

扬子晚报

2026-01-08 20:25:37

九年过去了，河北省的供暖依然是个问题

九年过去了，河北省的供暖依然是个问题

小星球探索

2026-01-08 19:24:25

丹麦国防部：若美国武力夺取格陵兰岛丹麦士兵可“先开枪再请示”

丹麦国防部：若美国武力夺取格陵兰岛丹麦士兵可“先开枪再请示”

财联社

2026-01-08 14:40:05

美媒曝光：美国出动海豹突击队在北大西洋扣押“贝拉1”号油轮

美媒曝光：美国出动海豹突击队在北大西洋扣押“贝拉1”号油轮

环球网资讯

2026-01-08 14:46:06

物理AI赛道的中美角逐：小鹏与特斯拉的“共识”与“超越”

物理AI赛道的中美角逐：小鹏与特斯拉的“共识”与“超越”

澎湃新闻

2025-12-31 16:00:36

字母哥放话永不申请交易：想在雄鹿打完生涯除非他们不再想要我

字母哥放话永不申请交易：想在雄鹿打完生涯除非他们不再想要我

罗说NBA

2026-01-08 22:56:51

法官隐名：一场悄无声息的XXX

法官隐名：一场悄无声息的XXX

呦呦鹿鸣

2026-01-07 22:12:24

票房大反转：《阿凡达3》跌至第三，寻秦记第二，第一成功逆袭

票房大反转：《阿凡达3》跌至第三，寻秦记第二，第一成功逆袭

糊咖娱乐

2026-01-07 17:08:47

曼城冬窗强援！6500万拿下顶级飞翼：20场10球签约5年半

曼城冬窗强援！6500万拿下顶级飞翼：20场10球签约5年半

叶青足球世界

2026-01-08 19:33:17

网传某国产操作系统大厂老董开除核心工程师，理由竟是 “没穿西装”

网传某国产操作系统大厂老董开除核心工程师，理由竟是 “没穿西装”

可达鸭面面观

2026-01-08 19:48:13

哈佛发现：高血脂不用治，治好都是误诊？告诉您5个血脂真相！

哈佛发现：高血脂不用治，治好都是误诊？告诉您5个血脂真相！

岐黄传人孙大夫

2026-01-08 10:06:20

持续分享AI实践干货，走超级个体崛起之路

25文章数 15关注度

往期回顾全部

科技要闻

智谱拿下“全球大模型第一股”，凭什么

头条要闻

19岁小伙在柬疑被16万转卖与母亲视频时按"酒窝"求救

头条要闻

19岁小伙在柬疑被16万转卖与母亲视频时按"酒窝"求救

体育要闻

世乒赛银牌得主，说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播，获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变吉利在CES打出了五张牌

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

数码

教育

旅游

房产

公开课

数码要闻

CES 2026 | TCL实业携全球首创SQD-Mini LED显示技术亮相

教育要闻

高二不救，基本原地告别高考

旅游要闻

美翻了！深圳一地铁口惊现浪漫果冻海

房产要闻

豪宅抢疯、刚需捡漏……2025年，一张房票改写了广州市场格局

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版