网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

程序员花2小时造假数据，测试流程比真数据还稳

2026-04-10 09:52:26　来源: 闪存猎手

北京举报

0

分享至

做数据建模最烦的不是代码报错，是数据集比老板的承诺还虚。客户信息不能碰，真实样本凑不够，项目卡在原地打转——这种场景每个数据工程师都懂。

有人用numpy和pandas搭了个取巧方案：随机生成姓名、年龄、消费记录，再套上正态分布让数据看起来"像那么回事」。这套假数据能撑过单元测试、压力测试，甚至能骗过肉眼初筛。

关键是速度。两小时搭完的生成器，能吐出十万条记录，字段关联逻辑比某些公司的数据库还干净。团队不用再等法务审批，测试迭代周期从周压缩到天。

但隐患也明显。分布参数拍脑袋定的，极端值场景覆盖不到，上线前还得换真数据跑一遍。有工程师在GitHub吐槽：这工具救急可以，当主食会营养不良。

目前该方案已在三个内部项目落地，生成的假用户画像被产品经理拿去做了两轮原型验证——直到第三轮才有人发现"客户"年龄中位数精确到小数点后两位。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

网易云音乐，卡在算法和活人之间

钛媒体APP 2026-02-24 15:56:08
77 跟贴 77
SBTI一夜爆红：反卷的里子，AI的路子、微信的场子

钛媒体APP 2026-04-10 18:22:42
0 跟贴 0

他在设计那款游戏时，偷偷在代码里藏了一个彩蛋

星星科普 2026-04-08 19:19:04
7 跟贴 7

35岁程序员摆摊卖肉蛋堡月入5万引质疑

21世纪经济报道 2026-04-09 15:49:43
225 跟贴 225
程序员女婿进门就跪，把丈母娘都整不会了

短尾剧社 2026-04-08 10:16:12
2 跟贴 2

涉霍尔木兹海峡马来西亚和新加坡吵了起来

澎湃新闻 2026-04-10 08:05:06
17964 跟贴 17964

实际到位1亿元，上报金额78亿元，数据造假的背后原因更重要

谭浩俊 2026-04-10 09:09:15
1 跟贴 1
豆包自称"我不是代码是真人"，真相太意外！

主持人扬帆 2026-04-10 16:39:22
0 跟贴 0

裴矩与知世郎，《镖人》中角色的历史原型都是谁？

穷历史 2026-04-06 12:30:00
0 跟贴 0
多部门提醒苹果手机用户注意了

主持人浩然 2026-04-08 05:34:33
0 跟贴 0
Codeforces难题不够刷？谢赛宁等造了AI出题机，能生成原创编程题

机器之心Pro 2025-10-20 14:17:05
0 跟贴 0
蔡磊选择战斗，因为有比恐惧更重要的事

叶檀财经 2026-04-08 21:34:55
0 跟贴 0
分享一个好用的Skill，企业背调、深度调研一键搞定！

钛媒体APP 2026-04-10 11:04:29
0 跟贴 0
Semianalysis：智能体火爆，CPU成为新的“AI瓶颈”

华尔街见闻官方 2026-04-09 20:25:07
0 跟贴 0
想不到这东西也能造假：木材空心了，大哥有办法

风吹天涯路 2026-04-09 03:03:59
0 跟贴 0
媒体：中方一直担忧美印在中东使坏 20年前就开始布局了

澎湃新闻 2026-04-10 07:12:09
8037 跟贴 8037
GenEval从61%狂拉到92%，全面超越GPT-4o的TDM-R1模型来了

机器之心Pro 2026-04-09 19:57:13
0 跟贴 0
代码故障的猫

暖暖萌萌 2026-04-09 10:45:57
0 跟贴 0
时薪20美元，还得凌晨4点“抢单”！60岁程序员、年薪50万医生失业后，靠“训练AI”续命

CSDN 2026-04-10 14:05:51
10 跟贴 10
77亿省外资金全靠编，河南爆出巨额数据造假

21世纪经济报道 2026-04-09 20:12:45
0 跟贴 0
为什么说吃喝嫖赌才是底层代码？

乔巴是只狗 2026-04-07 10:03:27
0 跟贴 0
日本“降级”中日关系中方表态

参考消息 2026-04-10 14:22:31
96 跟贴 96
中介带看1900万大平层后等着30万佣金不料开发商不认

1818黄金眼 2026-04-10 12:40:51
1396 跟贴 1396
用户的钱就是这样没的

阿萌讲电影 2026-04-09 09:11:39
1 跟贴 1
美国推演：7天打掉4万解放军？参数一扒就露馅

半路友人之他 2026-04-10 02:11:31
1 跟贴 1
4月9日，《焦点访谈》曝光!上报到位资金78亿实际仅1亿多，河南三地曝出巨额数据造假，基层无奈"上级

中安在线 2026-04-09 11:14:34
0 跟贴 0
四川程序员开发App，AI自动识别违停，一键拍摄上报

极果酷玩 2026-04-09 17:05:44
0 跟贴 0
78个亿实际不足一亿！河南3地数据造假，他们的锅，老百姓买单？

慢半拍sir 2026-04-09 11:08:05
0 跟贴 0
上报78亿，实到不足1亿！河南三地曝出巨额数据造假

起点新闻 2026-04-09 10:05:08
0 跟贴 0
男子为看病自学代码抢号，后发现“商机”联手妻子做“黄牛”，代抢各大医院号源获利57万元被判刑！

河南都市频道 2026-04-09 15:19:22
0 跟贴 0
33岁程序员午休健身猝死，法院判定属工作时间范畴

齐鲁频道 2026-04-09 13:32:45
0 跟贴 0
龙虾军团有了最强「视力」！一眼看图直接写代码-1

机器之心Pro 2026-04-02 16:56:32
0 跟贴 0
“祖先给的特权”，河南网友称祖坟在景区祭祖免票，景区回应：没过检票口，一般是附近住户的祖坟

大风新闻 2026-04-06 15:06:12
3913 跟贴 3913
大专学历、零基础，可以学会上位机编程吗？

华山自控编程 2026-04-07 21:05:00
0 跟贴 0
久病成“黑客”？男子为看病自学代码，竟靠代抢医院号源狂捞57万

掌闻视讯 2026-04-09 11:37:06
0 跟贴 0
探索无限：2的根号迭代之旅

文明不过星感冒v 2026-04-08 10:40:09
0 跟贴 0
热搜上从来不缺“神话”，却永远改不了骗人的本质

迷世书童H9527 2026-04-10 08:59:34
0 跟贴 0
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
感觉是程序员带了情绪写的，这才是正宗的倒计时，一点秩序没有！

搞笑新奇怪 2026-04-09 13:27:16
1 跟贴 1
杭州回应西湖连续一周撒7吨漂白粉

第一财经资讯 2026-04-09 21:37:11
4082 跟贴 4082

郑丽文的婚姻：女主外男主内，不生育孩子，事业理想置于家庭之上

郑丽文的婚姻：女主外男主内，不生育孩子，事业理想置于家庭之上

芳芳历史烩

2026-04-08 16:28:15

康师傅“再来一瓶”多店不兑换！消费者跑多家门店皆失败，怒斥：没能力就别做活动

康师傅“再来一瓶”多店不兑换！消费者跑多家门店皆失败，怒斥：没能力就别做活动

新浪财经

2026-04-09 18:35:29

车臣一把手下令，大军备战，俄方正式摊牌，或准备歼灭5万美军

车臣一把手下令，大军备战，俄方正式摊牌，或准备歼灭5万美军

兵说

2026-04-09 16:59:25

副县长出轨致下属怀孕还吃空饷依法应辞退！不是降为正科级了事！

副县长出轨致下属怀孕还吃空饷依法应辞退！不是降为正科级了事！

一支破笔半支烟

2026-04-09 14:52:22

特斯拉上架 Model Y 改款，更好看了！

特斯拉上架 Model Y 改款，更好看了！

花果科技

2026-04-10 10:39:44

“枭龙”战机高光时刻！巴空军进入伊朗领空，为伊朗战斗护航

“枭龙”战机高光时刻！巴空军进入伊朗领空，为伊朗战斗护航

潮鹿逐梦

2026-04-10 12:17:21

优酷肠子都悔青了！3亿砸的“S+顶流剧”，播到第9集广告商全跑光

优酷肠子都悔青了！3亿砸的“S+顶流剧”，播到第9集广告商全跑光

许三岁

2026-04-10 09:30:06

欣旺达成为特斯拉供应商！

电动知家

2026-04-10 09:22:44

绍兴一博物馆战国青铜剑被指多处“拼接痕”，库保员：入库时登记“完整”，但“拼接痕”说不清楚

绍兴一博物馆战国青铜剑被指多处“拼接痕”，库保员：入库时登记“完整”，但“拼接痕”说不清楚

新京报

2026-04-10 16:44:49

网红“一栗小莎子”因癌症剃光头，再穿蓝衣仍漂亮，老公也理光头

网红“一栗小莎子”因癌症剃光头，再穿蓝衣仍漂亮，老公也理光头

裕丰娱间说

2026-04-10 18:58:05

长公主被家暴流产了

毒舌扒姨太

2026-04-08 22:29:19

张雪峰离世半个月公司大变化！10点上班7点到，武亮透露具体安排

张雪峰离世半个月公司大变化！10点上班7点到，武亮透露具体安排

裕丰娱间说

2026-04-10 07:03:34

美国AI三巨头联手限制蒸馏：最便宜的那条路，被掐断了

美国AI三巨头联手限制蒸馏：最便宜的那条路，被掐断了

卢松松

2026-04-08 14:07:41

iPhone Ultra 售价曝光，国行起售价 17,999 ！

iPhone Ultra 售价曝光，国行起售价 17,999 ！

XCiOS俱乐部

2026-04-09 13:52:43

中年男人最大的悲哀是什么？网友：我，中年女人，也对啥都没兴趣

中年男人最大的悲哀是什么？网友：我，中年女人，也对啥都没兴趣

带你感受人间冷暖

2026-04-10 01:21:44

陈丽华的富华国际集团旗下有哪些知名品牌

陈丽华的富华国际集团旗下有哪些知名品牌

蓝色海边

2026-04-10 03:35:13

全红婵又遭网暴！哥哥怒怼网友：我们全家都胖？吃你们家大米了？

全红婵又遭网暴！哥哥怒怼网友：我们全家都胖？吃你们家大米了？

念洲

2026-04-10 08:40:37

有没有人敢爆自己的瓜？网友：确定玩这么大吗？

有没有人敢爆自己的瓜？网友：确定玩这么大吗？

夜深爱杂谈

2026-02-18 20:55:58

中国通用技术（集团）原总经理助理李克全接受监察调查

中国通用技术（集团）原总经理助理李克全接受监察调查

界面新闻

2026-04-10 10:01:37

3月车市大变局：Model Y狂揽3.9万销量，小米Yu7跌出榜单

3月车市大变局：Model Y狂揽3.9万销量，小米Yu7跌出榜单

侃故事的阿庆

2026-04-10 17:57:47

全网蹲好价的野生捕手，算力与羊毛都不可辜负。

1064文章数 8关注度

往期回顾全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

73岁骑友抄近路摔倒身亡女儿：赔偿问题无法达成共识

头条要闻

73岁骑友抄近路摔倒身亡女儿：赔偿问题无法达成共识

体育要闻

17岁赚了一百万美元，25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情！聚会细节被扒

财经要闻

李强主持召开经济形势专家和企业家座谈会

汽车要闻

搭载第二代刀片电池及闪充技术腾势N8L闪充版预售35万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戏

旅游

家居

公开课

本地新闻

12吨巧克力有难，全网化身超级侦探添乱

大话西游手游交易服热销物资第三期！一组仙器龙马号多少钱？

旅游要闻

第十四届澳门旅博会开幕首次组织中亚旅游业界访澳考察

家居要闻

复古风格自然简约

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版