2023年,企业平均要在6个不同系统里翻找信息才能解决一个客户问题。到2025年,这个数字变成了11个。
数据来自Gartner最新调研。不是模型不够聪明,是模型根本「看不见」——你的工单系统、邮件记录、内部Wiki、Slack频道,对GPT-4o来说全是黑箱。
上下文鸿沟,正在成为AI落地的最大卡点。
这篇文章讲一家叫Glean的公司,怎么靠「知识基建」这个老掉牙的概念,在估值上翻了8倍,把OpenAI和微软的企服野心架在火上烤。
01|从「搜索框」到「上下文层」:一场迟到十年的架构革命
Glean的创始人Arvind Jain是Google搜索的老兵,2003年入职,干了14年。2019年他出来创业时,投资人问他:企业搜索不是死透了吗?SharePoint、Confluence、Notion,哪个不能搜?
他的回答是:你们搜的是文档,我要搜的是「谁懂这个」。文档是静态的,知识是活的——它藏在上周三的Slack thread里,在Salesforce备注的第三行,在那个离职同事三年前写的、已经被归档的代码注释里。
Glean的核心架构分三层:连接器层(200+企业系统)、统一索引层、权限感知层。
前两层不稀奇。第三层是命门——它让AI回答「Q3预算」时,自动过滤掉你没权限看的部门数据,同时把你上周在邮件里提过的数字优先置顶。这叫「工作图谱」(Work Graph),不是图谱技术多新,是敢把「组织政治」写进产品逻辑。
2022年ChatGPT发布前,Glean估值4.6亿美元。2024年9月D轮融资,22亿美元。18个月,估值翻了近5倍。同期OpenAI的Enterprise产品还在跟客户扯数据合规的皮。
02|RAG的陷阱:为什么「接入知识库」是个伪命题
现在是个做大模型的都在喊RAG(检索增强生成,Retrieval-Augmented Generation)。逻辑很顺:模型不懂我司业务?把内部文档塞进去让它查。
Arvind Jain在2024年5月的访谈里直接开炮:「RAG是个技术名词,不是产品。客户要的不是检索,是答案。」
他举了个例子:销售问「这个客户上次投诉是什么」。传统RAG流程是:搜文档→找相关段落→拼给模型→生成回答。Glean的做法是:直接问连接器——Salesforce里有没有Case?Zendesk里有没有Ticket?邮件里有没有re:主题?把结构化数据、半结构化对话、非结构化附件一次性拉齐,再判断哪个信息源更「新鲜」、哪个同事的处理记录更「可信」。
这里的关键是「可信度评分」,不是算法多精妙,是敢承认「官方文档经常过时,一线员工的Slack吐槽反而更准」。
这套逻辑让Glean的AI助手在2024年客户满意度调研中,回答准确率比纯RAG方案高出34%。数据来源是Glean官方博客公布的内部基准测试,样本量没披露,但参与对比的是某头部云厂商的Copilot产品。
03|权限即产品:被忽视的「组织动力学」
企业软件有个诅咒:功能越全,用的人越少。Notion有搜索,但没人用;Google Workspace有搜索,但搜出来100页结果没人翻。
Glean的解法是把「权限」做成动态过滤器,而不是静态门槛。什么意思?
传统权限是二元的:你能看/不能看。Glean的权限是概率的:这个文档你「很可能需要」,那个同事你「应该认识」,这个项目你「上周刚被拉进群」。这些信号来自200+系统的交叉验证——你在GitHub review了某段代码,系统自动提升相关Jira ticket的推荐权重。
2024年Glean发布的「AI Answers」功能,把这套逻辑推到前台。用户提问后,AI不仅给答案,还附带「信息溯源卡片」:答案来自3个系统,其中Salesforce数据最新(2小时前),Confluence页面有警告标记(180天未更新),Slack对话涉及你已屏蔽的同事(已折叠)。
这种「透明的不完美」,反而比「黑箱式的自信」更让用户敢用。
一个细节:Glean的界面里,每个AI回答右下角都有个「这对你有用吗?」的拇指按钮。点击「没用」,系统会追问「是因为信息过时、权限不对、还是答非所问?」——这三个选项直接对应产品团队的三个OKR。
04|OpenAI的反击与Glean的「截胡」
2024年1月,OpenAI正式发布ChatGPT Enterprise,主打「企业级安全与隐私」。同年3月,微软Copilot for Microsoft 365全面上市,捆绑Office全家桶。
两套打法都很凶:OpenAI靠模型能力降维打击,微软靠生态入口卡位。但到2024年底,Glean的客户名单里多了Databricks、Duolingo、Canva、Okta——全是技术栈复杂的「多系统怪胎」,正是OpenAI和微软最难啃的骨头。
Arvind Jain的回应很产品经理:「我们不是在做AI,是在做AI的上下文层。模型会迭代,但你的工单系统、代码仓库、HR系统不会消失。我们比任何大模型公司都懂怎么跟这些『老古董』跳舞。」
这句话的底气来自数据:Glean目前连接的企业系统超过200个,覆盖SaaS、本地部署、自定义API三类。OpenAI的Enterprise解决方案官方文档显示,原生集成的主要系统约15个,其余需通过第三方中间件或自建管道。
差距不在技术,在「脏活」的积累——每个连接器都要谈商务条款、处理OAuth变体、适配版本迭代。Glean从2019年开始啃,啃了5年。
05|2025年的变量:Agent时代重新定义「上下文」
2024年下半年,Glean的产品重心转向「Agent构建平台」。逻辑很直接:既然我掌握了全公司的知识图谱,为什么不直接让AI去「做事」,而不仅是「回答」?
新功能「Glean Actions」允许企业用自然语言定义工作流:「当销售在邮件里提到『合同条款』,自动拉取法务部最新模板、比对客户历史版本、生成差异报告、@相关同事。」
这里的「上下文」从「信息检索」升级到「意图理解」——系统要判断「提到合同条款」是抱怨、是询问、还是谈判信号,再触发不同动作链。
Arvind Jain在2024年10月的SaaStr Annual上放话:「未来18个月,80%的『AI助手』会死掉,因为它们没有上下文层。用户不会为了聊天而聊天,他们要的是『那个懂我公司的人』。」
这个预测够狠,但数据侧面印证:Glean的2024年年度经常性收入(ARR)同比增长超过200%,客户续约率96%。同期,据The Information报道,多家部署了微软Copilot的500强企业反馈「使用率低于预期」,部分合同在续约谈判中被压价。
上下文护城河的本质,不是技术壁垒,是「组织记忆」的垄断。
当你的AI助手记得「三年前那个项目为什么失败」、「哪个同事擅长处理这类客诉」、「上周CEO在All-hands上随口提的优先级」,它就不再是工具,而是「组织本身」的延伸。
Glean的竞争对手名单里,除了OpenAI、微软,现在多了Notion(2024年推出Notion AI Q&A)、Google(Workspace Duet升级)、以及一堆垂直领域的RAG创业公司。但Arvind Jain的应对策略很老派:继续签连接器,继续磨权限引擎,继续把「理解你的公司」这件事做重。
2025年1月,Glean宣布与ServiceNow达成战略合作,后者是企业服务管理(ESM)领域的绝对巨头。这笔合作的潜台词是:Glean不打算自己吃掉所有场景,而是成为「企业AI的上下文基础设施」——就像AWS是计算基础设施,Snowflake是数据基础设施。
这个定位如果跑通,估值模型会从「SaaS公司」变成「平台层公司」。区别是:SaaS按席位收费,平台层按调用量或数据量收费,天花板完全不同。
最后一个细节来自Glean的官网招聘页。他们正在招「组织人类学家」(Organizational Anthropologist),职位描述里写:「理解不同行业、不同规模、不同文化的企业,如何让知识流动或窒息。」
不是算法工程师,不是产品经理。是人类学家。
当所有公司都在卷模型参数时,这家公司相信:AI的下一个战场,是「谁更懂你的会议室政治」。你觉得这是过度乐观,还是押对了方向?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.