![]()
澳大利亚每年产生超过1.8万份建筑开发申请(Development Application,简称DA),分散在330多个地方议会,每天更新。这些数据公开、免费,却长期躺在政府网站的PDF里发霉。
一位产品经理团队花了18个月,把它变成了实时商机推送系统。 plumber 早上醒来,手机弹出3条通知:你家15公里内,昨天有人申请了泳池建造许可。
这不是概念验证。他们已经跑通了 webhook 订阅模式,客户按邮编订阅,新DA自动推送。数据从"政府公开义务"变成了"销售线索引擎"。
DA数据的真实结构:不只是"某人要盖楼"
单条DA记录包含的信息密度,远超大多数人想象。地址、申请类型(新建/翻新/拆除/泳池)、地块面积、拟建面积、预估造价、建筑师/工程师/施工方名称、预计工期、当前审批状态。
把这些字段拆开看,价值分层很明显。地址和类型是基础层——知道"哪里、要干什么"。造价和面积是财务层——判断项目规模和客户预算。参与方名单是网络层——锁定关键决策人。
但真正的杠杆点在时间戳。DA是前置指标,比实际开工早3-18个月。一个郊区过去6个月出现12份联排别墅申请,开发商看到的不是历史数据,是供需信号:这片地 council 在批,市场有人买,竞争对手已经进场。
团队做的第一件事是统一数据格式。各州议会系统互不兼容,新南威尔士州用一种字段命名,维多利亚州用另一种,昆士兰的部分议会还在发扫描件。他们写了330多个爬虫和解析器,把异构数据洗成统一 schema。
清洗后的数据量:日均新增200-400条有效记录,历史库超过400万条。覆盖周期最长的州可追溯到15年前。
可行性计算器的隐藏逻辑:用邻居的申请验证你的假设
他们把这个数据模块嵌进了一个更大的产品:房产开发可行性计算器。用户输入地址,系统返回的不只是理论容积率。
后台同时查询:该地址1公里内,过去6个月有多少同类申请获批?分别是联排、公寓还是独栋?平均审批周期多长? council 对这类项目的实际态度如何?
「开发者不再对着 zoning map 猜了。」团队负责人解释,「他们看到的是活生生的市场验证。如果3个联排项目正在走流程,说明这片地有人敢投、 council 肯批、银行愿贷。」
这个设计改变了工具的定位。从"帮我算理论最大值"变成"帮我判断现在进场算不算晚"。前者是静态分析,后者是时机决策。
![]()
数据层叠(data layering)的思路在这里很关键。单独的DA列表只是公告栏,叠加到具体地址的财务模型上,变成了风险指标。叠加到时间序列上,变成了趋势预测。叠加到地理围栏上,变成了商机雷达。
webhook 架构:让数据主动找人
最轻量级的集成方式,是反向推送。团队开放了一个API端点,允许第三方系统注册 webhook。指定触发条件——邮编范围、申请类型、造价区间——新DA匹配时自动POST到客户服务器。
代码示例很直白。一个 construction CRM 厂商只需要几行 Python,就能把"用户手动录入线索"变成"系统自动填充线索池"。
plumber 的案例就是这样跑起来的。西墨尔本某管道工,订阅了15公里内所有泳池DA。系统每天早上推送前日新增,附项目地址、预估造价、建筑师联系方式。他不再 cold call,直接拿着 council 已公开的申请信息上门报价。
拆除公司的用法更激进。他们订阅 demolition permit 的实时流, permit 刚提交就收到通知,比竞争对手早2-4周接触到业主。在拆除这个环节简单、价格透明的市场,先发接触就是胜率。
订阅模式按数据量分层。基础版覆盖单个邮编,企业版可画多边形地理围栏。API 响应包含完整原始字段,也提供清洗后的标准化版本。
被忽视的维度:DA作为区域经济脉搏
投资平台的用法又不一样。他们的用户本来就看租金回报率和资本增值,但这两个都是滞后指标。DA数据提供了前置视角。
某个郊区 subdivision DA 激增,意味着密度即将上升,存量独栋的稀缺性溢价可能收窄。 renovation DA 占主导,说明 gentrification 进行中,业主愿意自掏腰包改善,社区购买力在升级。 demolition permit 上涨,往往是旧房改公寓的前奏,土地价值重估窗口打开。
这些信号不需要复杂的机器学习。简单的时序统计——某类DA的同比环比、占区域总量的比例变化——已经足够做出差异化判断。
团队还在测试一个更细分的指标: council 审批速度。同一州内,不同议会对同类申请的处理周期可能相差3倍。把这个数据暴露给开发者,相当于提供了"监管风险"的量化参考。
数据产品的边界:什么该做,什么不该做
访谈中,负责人反复提到一个取舍:DA Leads 不做预测模型,只做高质量的数据管道和基础聚合。预测是客户自己的事,他们更清楚自己的业务逻辑。
![]()
这个定位避开了两个坑。一是过度承诺——用DA数据"预测房价"的准确性经不起检验,噪音太多。二是客户锁定——如果做太重,客户迁移成本高,但价值又不足以支撑高溢价。
当前的产品形态是模块化组件。可以嵌入 feasibility 工具,可以驱动 CRM 的线索流,可以 enrich 投资平台的区域分析。每个场景只取所需字段,不做全能仪表盘。
技术栈的选择也反映了这个思路。数据层用 PostgreSQL + PostGIS 处理地理查询,API 层用 FastAPI,webhook 投递用 Celery 队列保证可靠性。没有复杂的实时计算,延迟容忍在分钟级。
爬虫的维护成本是隐性开销。议会网站改版、验证码升级、PDF 格式调整,都需要人工介入。团队雇了2名专职数据工程师处理各州的格式漂移,这部分成本摊到订阅费里。
从公开数据到商业基础设施
这个案例的启示在于数据产品的设计哲学。政府公开数据的价值,往往不在数据本身,而在"实时性+结构化+可集成"的加工层。
原始DA数据一直存在,但330个网站、PDF格式、无统一索引,让它的使用成本高于价值。团队做的不是"获取数据"——任何人都能下载——而是"消除使用摩擦"。
更深一层,他们证明了垂直数据可以作为"基础设施"卖给多个行业。房地产、建筑、金融、保险,每个行业对DA数据的需求不同,但都需要同样的底层管道。这种跨行业复用,是数据产品规模化盈利的关键。
目前团队正在拓展两个方向。一是历史数据的深度挖掘——15年的DA记录可以训练区域发展周期模型,虽然他们不直接做预测,但可以输出特征工程后的数据集。二是跨数据源关联——把DA数据与土地交易、建筑许可(building permit,区别于开发申请)、竣工证书串联,形成项目全生命周期追踪。
一个未公开测试的功能是"竞争监控"。开发商可以订阅特定区域,自动追踪竞争对手的新申请。这比传统的市场调研快数周,且信息源是 council 官方记录,无法隐瞒。
如果这套模式复制到其他国家,最大的障碍不是技术,而是数据开放程度。澳大利亚的DA制度相对统一,各州都有强制公开要求。美国的市场更大,但 county-level 的数据标准和开放意愿参差不齐。英国的计划许可数据集中度更高,但更新频率和字段丰富度不如澳洲。
团队对扩张持谨慎态度。负责人提到,他们花了18个月才摸清澳洲各州的"数据地形"——哪些议会系统稳定、哪些经常改版、哪些字段可靠、哪些需要人工校验。这种 tacit knowledge 难以快速迁移。
回到起点:1.8万份日更数据,330个数据源,从PDF坟墓里被挖出来,变成了 plumber 的手机通知、拆除公司的抢先接触、开发商的竞争雷达。数据本身没有变,变的是它被组织、被传递、被使用的方式。
下一个问题是:当足够多的从业者开始依赖这个信号,信号本身会不会失效?如果所有人都在同一时刻收到同一批DA通知,先发优势就被稀释了。团队正在测试分层投递机制——付费等级决定延迟时间——但这又会引出新的公平性质疑。数据民主化之后,速度分层是否算一种新型特权?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.