网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Power BI工程师花6个月拆解VertiPaq：3个公式算准你的模型会膨胀多少

2026-04-14 10:58:53　来源: 像素与芯片

北京举报

0

分享至

如果你管着一个千万行级别的Power BI模型，"半年后这玩意会撑爆吗"这个问题值多少钱？答案是：可能够买一辆Model 3的Premium容量费用，或者一次凌晨三点的故障抢修。

一位做过Qlik引擎逆向的老兵最近对VertiPaq动了手。他的目标很简单——不是估算，是公式。输入今天的元数据，输出六个月后的字节级体积预测。Qlik那边他搞过AppSizePredictor，这次他想复制到Power BI。

结论先放这儿：基本能成，但有个诚实的坑。

VertiPaq的存储账本：每列就记三笔账

拆解结果比想象中干净。每一列的存储体积 = 数据本体 + 字典 + 层级结构。没有暗箱，没有魔法，就是这三项相加。

数据区存的是编码后的值，字典存的是唯一值映射表，层级结构（Hierarchy Size）服务于钻取和聚合路径。这三块的计算逻辑各自独立，意味着你可以分别建模、分别预测。

这位工程师的做法很产品经理：跑对照实验、比对生产环境的快照版本、逐字节验证公式。不是看文档猜，是让数据自己说话。

可预测的部分：字典和层级是老实人

字典体积跟唯一值数量基本线性挂钩。你加一行新数据，如果值已经存在于字典，字典不增重。这个特性让字典成为最容易预测的部分——看业务字段的基数增长曲线就行。

层级结构更乖。它的体积取决于列的数据类型和唯一值分布，公式稳定到可以写进Excel。对于日期列这种结构固定的字段，预测误差能压到5%以内。

真正麻烦的是数据区。

那个"诚实的坑"：数据区的压缩率会叛变

VertiPaq的列式压缩不是固定比率，它跟值的分布模式强相关。同一列，今天可能是10:1，下个月业务数据一变，可能变成6:1。这不是bug，是设计特性——引擎会动态选择编码方案。

这意味着你的预测公式必须留一个压缩率变量。不能假设历史压缩率代表未来，得给业务方一个区间：最好情况、最坏情况、以及最可能情况。产品经理管这叫"管理预期"，工程师管这叫"承认不确定性"。

这位老兵的原话是：「我想要的不是水晶球，是带误差范围的望远镜。」

这对你手里的容量规划意味着什么

如果你现在用"行数×平均字节"来估算模型增长，建议停下来。VertiPaq的存储逻辑跟行数不是线性关系，跟列的基数、分布、数据类型才是。

一个 practical 的折中方案：先按三公式拆分测算字典和层级，数据区则取过去三个压缩率的移动平均，再给一个±30%的浮动带。够不上数学级精确，但比拍脑袋准一个数量级。

那位工程师把验证过程发在了社区。最有趣的反馈来自一个评论区用户：「按这个公式回测了我们过去两年的增长，误差在12%以内。但去年Q4那次业务改版，压缩率直接崩了，模型差点撑爆P1容量。」

你的模型最近一次压缩率波动，发生在什么时候？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

何恺明首个语言模型：105M参数，不走GPT自回归老路

量子位 2026-05-13 09:21:00
0 跟贴 0
拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

机器之心Pro 2026-05-13 13:39:40
0 跟贴 0

刚刚，微信聊天记录能喂给AI了！我让它爬楼、砍价、整理信息

智东西 2026-05-13 15:48:56
0 跟贴 0

这届网民，唯恐失去最后的“数字喘息空间”

经济观察报 2026-05-13 15:26:33
0 跟贴 0
字节砍掉30%的AI项目？背后的真假与焦虑

钛媒体APP 2026-05-11 18:15:28
86 跟贴 86

全女工程师设计摩托，成品离谱到没人买！

一笑到底 2026-05-11 11:39:02
5 跟贴 5

豆包付费是字节整理Agent生态的开始

钛媒体APP 2026-05-11 17:00:17
1 跟贴 1
工程师操作厕所排水，用数理化一招搞定，不亏是知识分子！

生活杰杰乐 2026-05-09 11:10:27
1 跟贴 1

快手OneSearch-V2全量上线，生成式搜索进入「懂你」时代

机器之心Pro 2026-05-13 18:45:51
0 跟贴 0
字节15亿“救场”真人短剧

强调Next 2026-05-13 17:12:22
0 跟贴 0
林俊旸果然创业了！一个“Qwen负责人”头衔值135亿

量子位 2026-05-13 16:51:05
1 跟贴 1
退机票被豆包“坑”600元，网友：起诉字节！

三言科技 2026-05-13 18:17:14
14 跟贴 14
德国工程师第一次来重庆，上街后看愣住了：中国人太聪明了

铁甲雄狮 2026-05-09 16:30:41
0 跟贴 0
假一赔十厂家吃了大亏，不仅倒贴300万，还请了工程师来修复

电工维修技术 2026-05-11 16:10:59
0 跟贴 0
波兰工程师造出喷气式飞行摩托：最高时速200公里，预售价88万美元。（编辑：曼曼）投稿邮箱：3882

中安在线 2026-05-12 19:43:24
0 跟贴 0
装修中的行业黑话，工程师进行通俗讲解，网友：钉在墙上的电视算硬装还是软装

星沙时报 2026-05-11 15:21:34
0 跟贴 0
为了活着太不容易了，他们应该拿最高的工资，而不是那些专家

浩南想开了 2026-05-10 02:04:03
0 跟贴 0
替比亚迪说两句：这波公关操作，真把工程师坑了

新芒X 2026-05-10 19:36:36
5 跟贴 5
女工程师分享和张凌赫合作感受，敬业专注

江西都市现场 2026-05-12 09:50:17
0 跟贴 0
脉脉2026春招报告：AI科学家/负责人平均月薪超13万元断层领先

TechWeb 2026-05-13 20:34:45
0 跟贴 0
光纤挖断了真有人修啊

烈焰童子 2026-05-11 19:41:57
0 跟贴 0
没有电脑的年代，工程师居然已经用上“机械打印机”

小猫动漫 2026-05-13 09:33:41
1 跟贴 1
92年国企硕士工程师，180+话痨暖男，会照顾人，优点太多标题写不下

常州大喇叭 2026-05-13 17:00:41
0 跟贴 0
半导体工程师成日本婚恋“新王者”？背后是真正的安全感战争

老輪侃世界 2026-05-13 08:47:15
0 跟贴 0
韩媒：“无法与中国竞争”，本田回归上世纪60年代的研发体系！

有你便是晴天呢 2026-05-13 04:27:26
0 跟贴 0
青年工程师化身主播趣味科普硬核产品

中国青年报 2026-05-13 18:02:08
0 跟贴 0
1960年代精巧绘图工具套装，工程师的心头好物

装甲铲史官 2026-03-12 10:35:44
0 跟贴 0
烧烤店将排烟管对隔壁直吹邻居提议自费帮其改造遭拒店主：他说不想让我占地

荔枝新闻 2026-05-13 04:35:09
383 跟贴 383
中方对无核武国家鼓吹拥核言论表示关切

环球网资讯 2026-05-13 07:54:25
13067 跟贴 13067
表面数据很漂亮，实际充电却吃力，“大鲸”级的真实短板在哪？

陈虎点兵 2026-05-13 19:31:20
0 跟贴 0
嘴炮王者谭sir竟被逻辑女帝反杀成渣：愿大姐被岁月温柔以待

解压小剧场 2026-05-09 08:17:50
421 跟贴 421
【AI大模型安全与评测】从DeepSeek-V4拆解真实评估逻辑，90%的人都搞错了！企业级大模型评

卢菁老师 2026-05-09 09:07:47
0 跟贴 0
4月汽车销量发布前十名仅剩一款燃油车

每日经济新闻 2026-05-13 16:52:04
3984 跟贴 3984
李彦宏：别盯着token了，AI时代要看日活智能体数

智东西 2026-05-13 13:57:12
0 跟贴 0
U17国足胜卡塔尔惊险晋级亚洲杯淘汰赛，中国足球时隔21年重返世界大赛

文汇报 2026-05-13 07:48:10
1783 跟贴 1783
一张4090就能爆改！面壁智能MiniCPM-V 4.6，1B多模态卷出新高度

机器之心Pro 2026-05-13 14:18:42
0 跟贴 0
面条模型，做的和真的一模一样

牛道影视剪辑 2026-05-12 13:54:02
1 跟贴 1
九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
3041 跟贴 3041
女生到底有多深，记住这几个数据，在家也可以做测试

蓝精灵搞笑 2026-05-10 09:25:15
0 跟贴 0
识字不多，逻辑清晰！萌娃自创图文手绘梳理运动会要求

星辰视频 2026-05-13 08:57:34
1 跟贴 1

净利暴增3480%！电力掀涨停潮，10元以下潜力股扎堆冒头！

净利暴增3480%！电力掀涨停潮，10元以下潜力股扎堆冒头！

慧眼看世界哈哈

2026-05-13 14:56:26

打通出行全场景，卓驭与中国一汽携手推动智能驾驶规模化量产

打通出行全场景，卓驭与中国一汽携手推动智能驾驶规模化量产

买车大师

2026-05-13 18:44:41

关心：黄仁勋为什么能“压哨登机”

关心：黄仁勋为什么能“压哨登机”

观察者网

2026-05-13 16:22:20

被姚明抱着上奥运的抗震小英雄，曾发誓考上清华，18年后成了这样

被姚明抱着上奥运的抗震小英雄，曾发誓考上清华，18年后成了这样

云舟史策

2026-05-13 07:17:23

“摸奶子”惹争议!OPPO的流量反噬开始了

“摸奶子”惹争议!OPPO的流量反噬开始了

广告创意

2026-05-13 08:25:55

揭秘美总统外访阵仗有多夸张，血浆自带，安保足够打一场小型战争

揭秘美总统外访阵仗有多夸张，血浆自带，安保足够打一场小型战争

嫹笔牂牂

2026-05-12 16:44:04

日本严重缺油墨！全球知名薯片包装变黑白

日本严重缺油墨！全球知名薯片包装变黑白

环球零碳

2026-05-12 19:34:10

特斯拉中国官宣全新优惠，5.59 万即可提 Model 3 了！

特斯拉中国官宣全新优惠，5.59 万即可提 Model 3 了！

XCiOS俱乐部

2026-05-13 14:22:27

博士肄业生把985院长拉下马：同济刚免职，又有三所高校被爆造假

博士肄业生把985院长拉下马：同济刚免职，又有三所高校被爆造假

妍妍教育日记

2026-05-13 09:55:04

撕破脸了？国际足联官网剔除中文，甩出谈判筹码，遭40亿索赔压顶

撕破脸了？国际足联官网剔除中文，甩出谈判筹码，遭40亿索赔压顶

霁寒飘雪

2026-05-13 16:47:06

中国外交部发声：坚决反对、强烈谴责巴方有关行径！

中国外交部发声：坚决反对、强烈谴责巴方有关行径！

一个有灵魂的作者

2026-05-12 21:21:19

43岁百亿香港女富豪烧炭身亡，公司面临巨大财政压力，比港剧还惨

43岁百亿香港女富豪烧炭身亡，公司面临巨大财政压力，比港剧还惨

王二哥老搞笑

2026-05-13 18:34:29

多图丨美国总统特朗普抵达北京

新京报

2026-05-13 20:23:37

第一现场｜特朗普抵达北京，开启三天访华行程

第一现场｜特朗普抵达北京，开启三天访华行程

澎湃新闻

2026-05-13 20:45:03

公然拒挂国旗，订单全给日韩，长荣如今的结局早已注定

公然拒挂国旗，订单全给日韩，长荣如今的结局早已注定

潋滟晴方DAY

2026-05-11 06:31:37

陈宝国自曝：拍大宅门时，何赛飞不问青红皂白，直接给我一嘴巴子

陈宝国自曝：拍大宅门时，何赛飞不问青红皂白，直接给我一嘴巴子

她时尚丫

2026-05-12 23:32:24

近5万桌需退款！网红烤串店突然道歉并退钱，已有杭州人收到

近5万桌需退款！网红烤串店突然道歉并退钱，已有杭州人收到

上观新闻

2026-05-13 19:31:07

12年交车不足20辆！贾跃亭宣布FF转型：不造车了，改做具身智能机器人

12年交车不足20辆！贾跃亭宣布FF转型：不造车了，改做具身智能机器人

TechWeb

2026-05-13 10:07:03

医生呼吁：70岁以上老人，宁可吃热乎馒头喝稀粥，也别碰这些！

医生呼吁：70岁以上老人，宁可吃热乎馒头喝稀粥，也别碰这些！

芹姐说生活

2026-05-13 19:15:32

小米SU7 Ultra挖孔机盖案一审宣判：小米夸大宣传但不构成欺诈，退还2万元定金

小米SU7 Ultra挖孔机盖案一审宣判：小米夸大宣传但不构成欺诈，退还2万元定金

红星新闻

2026-05-13 20:49:05

像素与芯片

有态度网友ytd

3772文章数 24关注度

往期回顾全部

科技要闻

腾讯一季度营收1964.6亿元同比增9%

头条要闻

美国总统时隔9年再次访华特朗普抵达北京

头条要闻

美国总统时隔9年再次访华特朗普抵达北京

体育要闻

14年半，74万，何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉，网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑吉利银河"TT"申报图来了

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

手机

教育

房产

数码

干细胞能让人“返老还童”吗

手机要闻

红魔11S Pro+抢先看可视化双主动散热本月见

教育要闻

活动报名丨管理学博士预备课暨招生说明会@上海

房产要闻

卷疯了！最低杀到7字头！手握30万，海口楼市横着走！

数码要闻

九州风神玄冰600单塔散热器新增ARGB版本，119元起

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版