OpenAI花3年埋的「上下文护城河」，被这家小公司截胡了|微软|算法|谷歌|官方文档|知名企业|slack|openai

OpenAI花3年埋的「上下文护城河」，被这家小公司截胡了

分享至

2023年，企业平均要在6个不同系统里翻找信息才能解决一个客户问题。到2025年，这个数字变成了11个。

数据来自Gartner最新调研。不是模型不够聪明，是模型根本「看不见」——你的工单系统、邮件记录、内部Wiki、Slack频道，对GPT-4o来说全是黑箱。

上下文鸿沟，正在成为AI落地的最大卡点。

这篇文章讲一家叫Glean的公司，怎么靠「知识基建」这个老掉牙的概念，在估值上翻了8倍，把OpenAI和微软的企服野心架在火上烤。

01｜从「搜索框」到「上下文层」：一场迟到十年的架构革命

Glean的创始人Arvind Jain是Google搜索的老兵，2003年入职，干了14年。2019年他出来创业时，投资人问他：企业搜索不是死透了吗？SharePoint、Confluence、Notion，哪个不能搜？

他的回答是：你们搜的是文档，我要搜的是「谁懂这个」。文档是静态的，知识是活的——它藏在上周三的Slack thread里，在Salesforce备注的第三行，在那个离职同事三年前写的、已经被归档的代码注释里。

Glean的核心架构分三层：连接器层（200+企业系统）、统一索引层、权限感知层。

前两层不稀奇。第三层是命门——它让AI回答「Q3预算」时，自动过滤掉你没权限看的部门数据，同时把你上周在邮件里提过的数字优先置顶。这叫「工作图谱」（Work Graph），不是图谱技术多新，是敢把「组织政治」写进产品逻辑。

2022年ChatGPT发布前，Glean估值4.6亿美元。2024年9月D轮融资，22亿美元。18个月，估值翻了近5倍。同期OpenAI的Enterprise产品还在跟客户扯数据合规的皮。

02｜RAG的陷阱：为什么「接入知识库」是个伪命题

现在是个做大模型的都在喊RAG（检索增强生成，Retrieval-Augmented Generation）。逻辑很顺：模型不懂我司业务？把内部文档塞进去让它查。

Arvind Jain在2024年5月的访谈里直接开炮：「RAG是个技术名词，不是产品。客户要的不是检索，是答案。」

他举了个例子：销售问「这个客户上次投诉是什么」。传统RAG流程是：搜文档→找相关段落→拼给模型→生成回答。Glean的做法是：直接问连接器——Salesforce里有没有Case？Zendesk里有没有Ticket？邮件里有没有re:主题？把结构化数据、半结构化对话、非结构化附件一次性拉齐，再判断哪个信息源更「新鲜」、哪个同事的处理记录更「可信」。

这里的关键是「可信度评分」，不是算法多精妙，是敢承认「官方文档经常过时，一线员工的Slack吐槽反而更准」。

这套逻辑让Glean的AI助手在2024年客户满意度调研中，回答准确率比纯RAG方案高出34%。数据来源是Glean官方博客公布的内部基准测试，样本量没披露，但参与对比的是某头部云厂商的Copilot产品。

03｜权限即产品：被忽视的「组织动力学」

企业软件有个诅咒：功能越全，用的人越少。Notion有搜索，但没人用；Google Workspace有搜索，但搜出来100页结果没人翻。

Glean的解法是把「权限」做成动态过滤器，而不是静态门槛。什么意思？

传统权限是二元的：你能看/不能看。Glean的权限是概率的：这个文档你「很可能需要」，那个同事你「应该认识」，这个项目你「上周刚被拉进群」。这些信号来自200+系统的交叉验证——你在GitHub review了某段代码，系统自动提升相关Jira ticket的推荐权重。

2024年Glean发布的「AI Answers」功能，把这套逻辑推到前台。用户提问后，AI不仅给答案，还附带「信息溯源卡片」：答案来自3个系统，其中Salesforce数据最新（2小时前），Confluence页面有警告标记（180天未更新），Slack对话涉及你已屏蔽的同事（已折叠）。

这种「透明的不完美」，反而比「黑箱式的自信」更让用户敢用。

一个细节：Glean的界面里，每个AI回答右下角都有个「这对你有用吗？」的拇指按钮。点击「没用」，系统会追问「是因为信息过时、权限不对、还是答非所问？」——这三个选项直接对应产品团队的三个OKR。

04｜OpenAI的反击与Glean的「截胡」

2024年1月，OpenAI正式发布ChatGPT Enterprise，主打「企业级安全与隐私」。同年3月，微软Copilot for Microsoft 365全面上市，捆绑Office全家桶。

两套打法都很凶：OpenAI靠模型能力降维打击，微软靠生态入口卡位。但到2024年底，Glean的客户名单里多了Databricks、Duolingo、Canva、Okta——全是技术栈复杂的「多系统怪胎」，正是OpenAI和微软最难啃的骨头。

Arvind Jain的回应很产品经理：「我们不是在做AI，是在做AI的上下文层。模型会迭代，但你的工单系统、代码仓库、HR系统不会消失。我们比任何大模型公司都懂怎么跟这些『老古董』跳舞。」

这句话的底气来自数据：Glean目前连接的企业系统超过200个，覆盖SaaS、本地部署、自定义API三类。OpenAI的Enterprise解决方案官方文档显示，原生集成的主要系统约15个，其余需通过第三方中间件或自建管道。

差距不在技术，在「脏活」的积累——每个连接器都要谈商务条款、处理OAuth变体、适配版本迭代。Glean从2019年开始啃，啃了5年。

05｜2025年的变量：Agent时代重新定义「上下文」

2024年下半年，Glean的产品重心转向「Agent构建平台」。逻辑很直接：既然我掌握了全公司的知识图谱，为什么不直接让AI去「做事」，而不仅是「回答」？

新功能「Glean Actions」允许企业用自然语言定义工作流：「当销售在邮件里提到『合同条款』，自动拉取法务部最新模板、比对客户历史版本、生成差异报告、@相关同事。」

这里的「上下文」从「信息检索」升级到「意图理解」——系统要判断「提到合同条款」是抱怨、是询问、还是谈判信号，再触发不同动作链。

Arvind Jain在2024年10月的SaaStr Annual上放话：「未来18个月，80%的『AI助手』会死掉，因为它们没有上下文层。用户不会为了聊天而聊天，他们要的是『那个懂我公司的人』。」

这个预测够狠，但数据侧面印证：Glean的2024年年度经常性收入（ARR）同比增长超过200%，客户续约率96%。同期，据The Information报道，多家部署了微软Copilot的500强企业反馈「使用率低于预期」，部分合同在续约谈判中被压价。

上下文护城河的本质，不是技术壁垒，是「组织记忆」的垄断。

当你的AI助手记得「三年前那个项目为什么失败」、「哪个同事擅长处理这类客诉」、「上周CEO在All-hands上随口提的优先级」，它就不再是工具，而是「组织本身」的延伸。

Glean的竞争对手名单里，除了OpenAI、微软，现在多了Notion（2024年推出Notion AI Q&A）、Google（Workspace Duet升级）、以及一堆垂直领域的RAG创业公司。但Arvind Jain的应对策略很老派：继续签连接器，继续磨权限引擎，继续把「理解你的公司」这件事做重。

2025年1月，Glean宣布与ServiceNow达成战略合作，后者是企业服务管理（ESM）领域的绝对巨头。这笔合作的潜台词是：Glean不打算自己吃掉所有场景，而是成为「企业AI的上下文基础设施」——就像AWS是计算基础设施，Snowflake是数据基础设施。

这个定位如果跑通，估值模型会从「SaaS公司」变成「平台层公司」。区别是：SaaS按席位收费，平台层按调用量或数据量收费，天花板完全不同。

最后一个细节来自Glean的官网招聘页。他们正在招「组织人类学家」（Organizational Anthropologist），职位描述里写：「理解不同行业、不同规模、不同文化的企业，如何让知识流动或窒息。」

不是算法工程师，不是产品经理。是人类学家。

当所有公司都在卷模型参数时，这家公司相信：AI的下一个战场，是「谁更懂你的会议室政治」。你觉得这是过度乐观，还是押对了方向？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.