「1991年,Business Objects 申请了一项专利,让不会写 SQL 的业务人员也能拖拖拽拽做报表。」——35年后,同一批人又在争论同一个问题:AI 时代,这玩意儿该独立存在还是内嵌进数据平台?
一个被反复发明的轮子
![]()
语义层(semantic layer)不是什么新词。它比你用的 Python 还老,比互联网商业化还早。
1991年,Business Objects 提交了「关系数据库访问系统」专利,核心功能叫「Universes」。数据架构师把物理表和连接路径封装成业务对象——「客户」「产品」「销售额」——报表人员拖拖拽拽就能出数,不用碰 SQL。
这套逻辑在 2000 年代被 SAP 收购后沉寂。2010 年代云数据仓库兴起,Looker 用「LookML」重新发明了它。2020 年代 dbt 推出「metrics layer」,第三次轮回开始。
三次发明,三次改名,解决的是同一个痛点:业务语言和数据库语言之间的鸿沟。
它到底在干什么
语义层卡在原始数据和所有消费端之间——BI 看板、AI 代理、Python 笔记本、Excel、自研应用。它干三件事:
指标一致性。财务说的「收入」是确认收入扣除退款,销售说的「收入」是含待成交的签约额。没有语义层,两边各写 SQL,数字对不上,吵两周。语义层只定义一次,下游全部引用。
访问管控。营销分析师查客户数据,不该看到社保号;区域经理只能看自己区域的数据。行级安全、列脱敏、角色权限,在语义层统一定义,不管用什么工具查询都生效。
查询封装。业务人员不需要知道「客户流失率」要连三张表、过滤测试账号、算 90 天滚动窗口、再除以上期活跃客户数。语义层把这套逻辑包成一个可复用的定义,消费者直接问「流失率」就行。
AI 把老问题炸成了新危机
以前语义层是「好用」的问题,现在成了「能不能用」的问题。
AI 代理不会写 SQL,但会生成 SQL。它靠大模型的统计模式猜表名、猜连接条件、猜过滤逻辑。猜对了出数,猜错了幻觉——而且幻觉得特别自信。
没有语义层,AI 直接裸连数据仓库。一张表叫 `cust_ltv_v2_final_backup`,另一张叫 `customer_360_dbt_model`,AI 怎么知道哪个是权威定义?
语义层给 AI 一个受控的命名空间。指标、维度、权限全部预定义,AI 的生成空间被限制在已验证的业务逻辑内。这不是优化,是生存必需。
两条路线正在掐架
行业现在分裂成两派,没有中间地带。
独立派认为语义层必须是可插拔的模块化产品。你的数据在 Snowflake,BI 用 Tableau,AI 用自研代理——语义层作为中间件,统一服务所有下游。优势是不被单一平台绑架,迁移成本低。
原生派认为语义层应该内嵌在数据平台内部。Snowflake、Databricks、BigQuery 都在推自己的语义层功能。优势是性能——查询优化、缓存、权限检查都在同一引擎内完成,少一层网络跳转,少一套配置。
两派的根本分歧:你更怕 vendor lock-in(供应商锁定),还是更怕数据管道延迟和配置碎片化?
选边站的代价
这个选择会锁死你的 AI 数据架构五年。
选独立语义层,你获得灵活性,但承担集成成本。每个新工具接入都要对接 API,权限模型要对齐,查询性能要调优。团队里得有人专门养这个中间件。
选原生语义层,你获得开箱即用的性能,但押注单一平台。如果三年后迁移数据仓库,语义定义要全部重写,下游消费端全部重新对接。
更隐蔽的风险是:AI 代理的准确性取决于语义层的覆盖完整度。漏定义一个边缘指标,AI 就会绕过语义层直接查原始表,幻觉立刻回来。无论选哪派,「全覆盖」都是硬门槛,没有捷径。
35 年没变的是什么
Business Objects 的专利文件里有一句话:「业务用户无法直接操作关系数据库。」
2024 年,这句话改成「AI 代理无法可靠地操作关系数据库」,逻辑完全一致。技术栈换了三轮,人与数据之间的翻译层始终存在。
区别是:1991 年的翻译层服务人类报表人员,2024 年的翻译层服务 AI 代理。后者对错误零容忍——人看到数字不对会质疑,AI 会自信地继续算下去。
语义层的价值从未如此高,也从未如此脆弱。
行动清单
如果你正在评估数据架构,先回答三个问题:
第一,你的 AI 用例是内部辅助决策,还是面向客户的产品功能?前者可以容忍偶尔幻觉,后者必须零容错——这决定你能否接受原生语义层的黑箱。
第二,你的数据平台合同还剩几年?如果 18 个月内要续签或迁移,现在押注原生语义层等于给自己挖坑。
第三,谁拥有指标定义权?是数据团队、业务团队,还是 AI 团队?语义层的治理模型必须匹配权力结构,否则再先进的技术也是摆设。
35 年前,Business Objects 用拖拖拽拽解决了 SQL 门槛问题。今天,你需要用同样的抽象思维,解决 AI 的可靠性门槛——趁你的竞争对手还在让 AI 裸奔查数仓。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.