网易首页 > 网易号 > 正文 申请入驻

【教程】打造个人知识库,线上、免费

0
分享至

大家好,我是 Ai 学习的老章

中简单介绍了纯互联网的全托管 RAG 流水线,本文我们实操看看部署流程和效果。

AutoRAG

AutoRAG 是一个由 Cloudflare 提供的全托管检索增强生成(RAG)流水线,旨在简化开发者将上下文感知 AI 集成到其应用程序中的方式。

RAG 是一种通过从您自己的数据中检索信息并将其提供给大型语言模型(LLM)以生成更具体回答的方法。RAG 在查询时从数据源检索相关的信息,将其与用户的查询输入结合起来,然后将两者一起输入到 LLM 中生成基于您数据的响应。这使得 RAG 成为 AI 驱动的支持机器人、内部知识助手、文档中的语义搜索以及其他源为实真相不断演化的应用场景的理想选择。

构建 RAG 流水线需要拼凑多个组件——数据存储、向量数据库、嵌入模型、LLMs 以及自定义索引、检索和生成逻辑等等工具和服务拼接在一起,才能开始。维护它更是难上加难,随着数据的变化,须手动重新索引和重新生成嵌入,以使系统保持相关性和性能。

AutoRAG 要实现的就是将脆弱的胶水代码管道、脆弱的集成和不断的维护,变成一个简单的“提问,获得智能回答”的体验。从导入数据、自动分块和嵌入,到在 Cloudflare 的 Vectorize 数据库中存储向量,进行语义检索,并使用 Workers AI 生成高质量的响应。AutoRAG 会持续监控数据源和索引,使 AI 保持最新,无需手动操作。

Cloudflare 非常慷慨,目前 AutoRAG 完全免费,索引、检索和增强的计算操作不会产生额外费用。每个账户的 Max AutoRAG 实例 10,最大文件数 10000 个。

R2、Vectorize Stores、Workers AI、AI Gateway 都可能产生费用,但是免费额度足够个人测试使用了,比如我长期把 R2 当图床,从没产生过费用。Vectorize 也有每月 3000 万的向量维度查询。

具体可以看看:https://developers.cloudflare.com/autorag/platform/limits-pricing/

下面我们开始:

第一步,创建 R2 对象存储

访问https://dash.cloudflare.com/点击 R2 对象存储,创建存储桶

名称:html-bucker,点击创建

第二步,创建 Worker 抓取网页到 R2

本地创建一个空白文件夹

cd 过去后,创建一个名为browser-r2-worker的 Worker 项目:

npm create cloudflare@latest -- browser-r2-worker

设置时,请选择以下选项:

  • What would you like to start with? Choose Hello World Starter.
    从哪里开始?选择 Hello World 入门。

  • Which template would you like to use? Choose Worker only.
    使用哪个模板?选择仅 Worker。

  • Which language do you want to use? Choose TypeScript.
    使用哪种语言?选择 TypeScript。

安装@cloudflare/puppeteer,这允许你控制浏览器渲染实例:

npm i @cloudflare/puppeteer

将以下配置添加到您的 Wrangler 配置文件中,以便您的 Worker 可以使用浏览器渲染并使用新的 R2 存储桶:

{  "compatibility_flags": ["nodejs_compat"], "browser": { "binding": "MY_BROWSER"  }, "r2_buckets": [   {    "binding": "HTML_BUCKET",    "bucket_name": "html-bucket",   }  ], }

将 src/index.ts 的内容替换为以下框架脚本:

import puppeteer from "@cloudflare/puppeteer"; // Define our environment bindings interface Env {  MY_BROWSER: any;  HTML_BUCKET: R2Bucket; } // Define request body structure interface RequestBody {  url: string; } export default { async fetch(request: Request, env: Env): Promise { // Only accept POST requests if (request.method !== 'POST') { return new Response('Please send a POST request with a target URL', { status: 405 });   } // Get URL from request body const body = await request.json() as RequestBody; // Note: Only use this parser for websites you own const targetUrl = new URL(body.url);  // Launch browser and create new page const browser = await puppeteer.launch(env.MY_BROWSER); const page = await browser.newPage(); // Navigate to the page and fetch its html await page.goto(targetUrl.href); const htmlPage = await page.content(); // Create filename and store in R2 const key = targetUrl.hostname + '_' + Date.now() + '.html'; await env.HTML_BUCKET.put(key, htmlPage); // Close browser await browser.close(); // Return success response return new Response(JSON.stringify({    success: true,    message: 'Page rendered and stored successfully',    key: key   }), {    headers: { 'Content-Type': 'application/json' }   });  } } satisfies ExportedHandler ;

可以通过运行以下命令将其部署到 Cloudflare 账户中:

cd browser-r2-worker  npx wrangler deploy

回到 Cloudflare 控制台,可以看到 Worker 已经创建好了

这个worker的核心功能是使用puppeteer访问、阅读网页并将其保存为完整HTML到刚刚创建的 R2 存储桶。但是我按照官方教程遇到 Couldn't connect to server 错误,暂未解决,所以后续用手动上传文件来测试。

这一步本身也不够傻瓜,后续开发成插件自动执行会优雅一点。

curl -X POST https://browser-r2-worker. .workers.dev \ -H "Content-Type: application/json" \ -d '{"url": "https://blog.cloudflare.com/introducing-autorag-on-cloudflare"}'

第二步,创建 AutoRAG 并监控索引过程

  1. 选择创建 AutoRAG 并完成设置过程:

    1. 选择包含知识库的 R2 存储桶,在这种情况下,选择html-bucket

    2. 选择用于将您的数据转换为向量表示的嵌入模型。建议使用默认模型。

    3. 选择一个 LLM 来生成你的响应。建议使用默认项。

    4. 选择或创建一个 AI 网关以监控和控制您的模型使用情况。

    5. 将你的 AutoRAG 命名为my-rag

测试一下:

未上传任何文档情况

上传网页或其他文件

unsetunset第四步,测试并添加到应用程序unsetunset

AutoRAG 提供了 REST API,可以基于 API 开发应用:

curl https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/autorag/rags/{AUTORAG_NAME}/ai-search \-H 'Content-Type: application/json' \-H "Authorization: Bearer {API_TOKEN}" \-d '{  "query": "How do I train a llama to deliver coffee?",  "model": @cf/meta/llama-3.3-70b-instruct-sd,  "rewrite_query": true,  "max_num_results": 10,  "ranking_options": {    "score_threshold": 0.6  },  "stream": true,}'

具体参考:https://developers.cloudflare.com/autorag/usage/rest-api/

unsetunset总结unsetunset

Cloudflare 提供的仅是 RAG 解决方案,而非完整 RAG 应用。我觉得这一套流水线还是蛮方便流畅的,未来可以在网页采集环节开发一个浏览器插件,一键采集网页素材到自己的 R2 存储桶,类似 Obsidian 的 clippings 插件。

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个,谢谢你看我的文章,我们下篇再见!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国电信:全面转向token经营!

中国电信:全面转向token经营!

最通信
2026-03-25 20:45:14
4个LV包都是假的!女子送检后傻眼:全在专柜买的啊,最新回应

4个LV包都是假的!女子送检后傻眼:全在专柜买的啊,最新回应

半岛晨报
2026-03-25 15:30:03
张雪峰6年前已离婚,独女张姩菡只能分16.5%遗产,现任妻子占大头

张雪峰6年前已离婚,独女张姩菡只能分16.5%遗产,现任妻子占大头

枫红染山径
2026-03-25 16:56:22
旧手机回收价狂涨五六倍!回收商:开不了机的照样高价收

旧手机回收价狂涨五六倍!回收商:开不了机的照样高价收

快科技
2026-03-25 14:53:24
一张脸,全球都在“抄作业”

一张脸,全球都在“抄作业”

中国新闻周刊
2026-03-25 08:35:50
曝信达证券所长猥亵员工,长得很老实,女方颜值出众,合影曝光

曝信达证券所长猥亵员工,长得很老实,女方颜值出众,合影曝光

180视角
2026-03-25 17:34:12
伊朗称正在搜捕逃亡美军

伊朗称正在搜捕逃亡美军

界面新闻
2026-03-25 23:21:14
东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

湖人崛起
2026-03-26 09:32:48
周杰伦的INS被网友冲爆,新歌MV里手表调到“83”,疑用旧恋情炒作卖新唱片

周杰伦的INS被网友冲爆,新歌MV里手表调到“83”,疑用旧恋情炒作卖新唱片

回旋镖
2026-03-25 20:38:44
大快人心!伊朗强硬派海军将领毙命,中东总算少个搅局的刺头

大快人心!伊朗强硬派海军将领毙命,中东总算少个搅局的刺头

老马拉车莫少装
2026-03-25 20:25:12
1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

文史明鉴
2026-03-25 19:14:13
联大认定“奴隶制”为最严重反人类罪:123票赞成,美国、以色列、阿根廷共3票反对

联大认定“奴隶制”为最严重反人类罪:123票赞成,美国、以色列、阿根廷共3票反对

都市快报橙柿互动
2026-03-26 07:59:37
迪拜富商逛北京胡同时,扬言要买整条街,大爷一句话让他连夜回国

迪拜富商逛北京胡同时,扬言要买整条街,大爷一句话让他连夜回国

千秋文化
2026-03-25 21:45:38
从“价格战”到“定标准”,自主家轿三强重新定义“国民家轿”

从“价格战”到“定标准”,自主家轿三强重新定义“国民家轿”

汽车预言家
2026-03-25 10:25:08
均衡致远,穿越周期:均衡风格权益基金迎来“新浪潮”

均衡致远,穿越周期:均衡风格权益基金迎来“新浪潮”

投资时间网
2026-03-25 15:47:55
停炸五天的真正含义:伊朗被迫进入二选一困局

停炸五天的真正含义:伊朗被迫进入二选一困局

斌闻天下
2026-03-26 07:45:03
斩首”让一将功成万骨枯成为历史

斩首”让一将功成万骨枯成为历史

昊轩看世界
2026-03-23 18:50:52
张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

火山詩话
2026-03-26 07:32:38
U23国足2-2逼平泰国,名宿范志毅赛后点评言辞犀利,句句在理!

U23国足2-2逼平泰国,名宿范志毅赛后点评言辞犀利,句句在理!

田先生篮球
2026-03-25 22:37:26
中国海警局新闻发言人就菲海警煽宣炒作发表谈话

中国海警局新闻发言人就菲海警煽宣炒作发表谈话

界面新闻
2026-03-25 21:59:52
2026-03-26 10:16:49
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3289文章数 11116关注度
往期回顾 全部

科技要闻

硅谷因AI大裁员?一线工程师戳破真相

头条要闻

举天价零件发出灵魂拷问的美官员 自己被大学生质问了

头条要闻

举天价零件发出灵魂拷问的美官员 自己被大学生质问了

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰遗产分割复杂!是否立遗嘱成关键

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

手机
家居
亲子
游戏
健康

手机要闻

苹果macOS 26.4首次粘贴命令到终端将触发安全拦截

家居要闻

轻奢堇天府 小资情调

亲子要闻

期盼每个孩子天天都能睡好觉

不盯屏增量1000+!爽到昏厥的街机挖矿

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版