网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

笔记本47秒处理千万数据，不用Spark不花钱

2026-05-07 00:23:13　来源: 闪存猎手

北京举报

0

分享至

提到千万级数据分析，大多数人第一反应是Spark集群或者云数仓。我过去也一样——直到试了DuckDB。

结果出乎意料：4GB内存的笔记本，47秒跑完，零配置、零账单、零集群。

DuckDB是个嵌入式分析型数据库，定位类似SQLite，但专为OLAP场景设计。它完全在内存运行，采用列式存储和向量化执行。安装只需一行命令：pip install duckdb pandas，没有Docker、没有JVM、没有YAML文件。

我用Python生成了测试数据：1000万条金融交易记录，包含交易ID、用户ID、金额、地区、品类、欺诈标记和时间戳，数据量约0.78GB。

核心查询是个复杂聚合：按地区和品类分组，统计交易笔数、总金额、平均金额、欺诈笔数、欺诈率，以及金额的95分位数，且只取3月份之后的数据。DuckDB直接零拷贝挂载DataFrame，无需导入导出。

查询耗时47.3秒。作为对比，Pandas在这种规模的多维聚合+窗口函数场景下，内存和速度都会吃紧。

DuckDB快在三处设计：

列式存储——只读查询涉及的列，而非整行。上面这个查询只用了5个字段，IO大幅缩减。

向量化执行——批量处理数据，CPU缓存友好，SIMD指令加速。

零拷贝集成——与Pandas、Arrow、Polars共享内存，不重复序列化。

什么场景适合用它？探索性数据分析、本地原型验证、小到中型数据集（GB级）、不想为云资源付费的时候。数据量再往上走，或者需要多节点并行，还是得回到分布式方案。

但千万级这个甜点区，很多人其实高估了硬件门槛，低估了单机工具的进化。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

他用DeepSeek-V4手搓Agent，冲上GitHub热榜第一！

智东西 2026-05-07 08:51:24
0 跟贴 0
ClaudeCode之父：“全员编程”时代，企业真正领先在于“组织流程的代差”

华尔街见闻官方 2026-05-05 14:09:40
168 跟贴 168

国产双开源：让Mac成为你的私人AI工作站

机器之心Pro 2026-05-06 14:14:46
3 跟贴 3

Snapchat提出Canvas-to-Image：一张画布集成 ID、姿态与布局

机器之心Pro 2025-12-09 14:14:17
0 跟贴 0
DeepSeek做大→Mega MoE，Tri Dao团队加快→SonicMoE

机器之心Pro 2026-05-05 11:02:54
0 跟贴 0

美光高管：内存需求爆了，全球再建5座超级晶圆厂也不够

华尔街见闻官方 2026-05-06 16:38:35
24 跟贴 24

索尼拒绝重蹈微软覆辙！30GB vs 24GB：PS6掌机与主机内存差距缩减至30%

快科技 2026-05-06 19:22:07
3 跟贴 3
索尼三机齐发！PS6旗舰、Lite、掌机规格泄露全曝光

游民星空 2026-05-06 22:32:15
2 跟贴 2

受RAM供应危机影响，AYN正式取消Odin 3 Ultra掌机订单

龙剑秀南 2026-05-06 18:21:44
0 跟贴 0
华尔街见闻早餐FM-Radio | 2026年5月7日

华尔街见闻官方 2026-05-07 07:06:58
0 跟贴 0
能录音的AI戒指，是个伪需求吗？|一个95后的硬件生死局

36氪 2026-01-29 18:44:57
4 跟贴 4
离开笔记本两个月，他反而看清了工程师的盲区

硬核玩家2哈 2026-05-06 14:31:18
0 跟贴 0
都2026了，老黄竟然还没把N卡这bug完全修好。。。【X.PIN】

差评XPIN 2026-05-06 12:21:44
49 跟贴 49
DDR6内存研发正式启动！速度比DDR5再快一倍

快科技 2026-05-05 15:57:44
0 跟贴 0
女子深夜下班回家，竟被自家房门反锁在外

南阳日报 2026-05-06 19:18:04
363 跟贴 363
景区装电梯无痛爬山被质疑过度开发

极目新闻 2026-05-02 17:18:12
4162 跟贴 4162
豆包为什么选择了 “最low”的变现方式？

蓝鲸新闻 2026-05-06 11:20:09
495 跟贴 495
现在外面的科技都发展成这样了吗只需要一副眼镜就能随身携带电脑网友：对着空气笑得时候会不会很诡异

视听丝路 2026-05-05 17:26:19
1 跟贴 1
“排队3小时，打卡1分钟”，多景区迎“泼天流量”

澎湃新闻 2026-05-06 00:04:10
3887 跟贴 3887
体验MG 4X，十万左右，硬件配置挺厚道

苑叔聊车官方账号 2026-05-06 08:00:00
0 跟贴 0
两个哈佛女生用AI做电池故障排查，数月的工作量被缩到了几分钟

DeepTech深科技 2026-05-06 21:11:54
12 跟贴 12
Claude、GPT、Gemini 全灭，SWE-Bench作者新作把AI圈干沉默了

机器之心Pro 2026-05-07 10:30:19
0 跟贴 0
人形机器人交付元年，行业从卷模型转向拼数据

DeepTech深科技 2026-05-07 10:47:56
0 跟贴 0
媒体：来南京下跪才是真忏悔

极目新闻 2026-05-07 00:57:37
3079 跟贴 3079
疯了！游戏本逆天改装：一颗电阻4090反杀5090！

雷科技 2025-11-11 18:57:46
0 跟贴 0
很多人说 MacBook Neo 不够用

爱范儿 2026-03-11 07:11:25
0 跟贴 0
日本挑衅不停，中方重磅文件亮剑，战败国身份再成焦点

附允历史观 2026-05-05 15:44:47
0 跟贴 0
14年来最好修的苹果电脑，MacBook Neo堪称史诗级改变

爱范儿 2026-03-16 21:57:44
0 跟贴 0
史诗级性价比！¥3000多的MacBook香不香？

爱范儿 2026-03-06 19:59:33
0 跟贴 0
15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案

机器之心Pro 2025-12-23 12:52:34
0 跟贴 0
丢了7年的手机突然发回定位还自动拍下了使用者的照片失主：已经成功要回了手机

闪电新闻 2026-05-06 12:58:59
1231 跟贴 1231
男子耐心训练小边牧，物品扔出后听指令乖乖叼回，网友：这智商也太高了

先锋音乐 2026-05-05 09:30:13
14 跟贴 14
伊朗十年埋雷：美国通信设备藏后门，中国为何一颗芯片都不敢买？

爱尔爱电影 2026-05-07 05:03:45
1 跟贴 1
发售即售罄！V社开放全新Steam手柄全套CAD文件，玩家改装自由

泡泡网 2026-05-07 11:15:37
0 跟贴 0
空腹抽血，喝水算不算破坏？很多人意外！检验科医生权威解答

环球网资讯 2026-05-06 13:46:09
819 跟贴 819
首款8K AI拇指运动相机，光子跃迁LEAPTIC Cube开启预售

钛媒体APP 2026-05-06 15:31:24
9 跟贴 9
CVPR 2026 | 20步也能稳住画质，这个扩散加速方法不一样

机器之心Pro 2026-04-10 18:40:17
0 跟贴 0
Windows取消强制更新，从此不再打扰用户

快科技 2026-05-06 19:59:46
0 跟贴 0
领先于Transformer！

机器之心Pro 2026-05-06 17:01:48
0 跟贴 0
媒体：伊朗袭击阿联酋并非军事冲动总统再次公开道歉

中国新闻周刊 2026-05-06 18:10:56
248 跟贴 248

“胜利的重孙辈”：一场关于共情的错位

“胜利的重孙辈”：一场关于共情的错位

秋月独朗

2026-05-06 16:15:44

卢卡・东契奇伤病重大更新，对湖人而言是糟糕消息

卢卡・东契奇伤病重大更新，对湖人而言是糟糕消息

夜白侃球

2026-05-07 10:37:22

吴宜泽载誉归国深夜低调抵西安获粉丝接机+送花夺冠后首秀确定

吴宜泽载誉归国深夜低调抵西安获粉丝接机+送花夺冠后首秀确定

我爱英超

2026-05-07 08:26:52

就在今天！下午5点，郑钦文冲2连胜；罕见发怒！萨巴伦卡炮轰法网

就在今天！下午5点，郑钦文冲2连胜；罕见发怒！萨巴伦卡炮轰法网

大秦壁虎白话体育

2026-05-07 08:53:10

一位特殊的客人来到北京

牛弹琴

2026-05-07 07:40:57

到2030年，持有现金和持有房产的人，终将会有两种截然不同的结局

到2030年，持有现金和持有房产的人，终将会有两种截然不同的结局

说故事的阿袭

2026-05-06 14:50:47

日媒：被誉为“史上最强”的中国U17爆冷输球；日籍主帅战术遭质疑

日媒：被誉为“史上最强”的中国U17爆冷输球；日籍主帅战术遭质疑

懂球帝

2026-05-07 00:42:23

高市早苗之下跪，不是东施效颦，是荒诞不经！

高市早苗之下跪，不是东施效颦，是荒诞不经！

新民周刊

2026-05-07 09:07:23

一屋子专业演员，愣是演不过一个跨界戏子，我想说烂不是没理由的

一屋子专业演员，愣是演不过一个跨界戏子，我想说烂不是没理由的

一娱三分地

2026-05-05 16:47:40

一屋子专业演员，愣是演不过一个跨界说相声的，难怪观众不买账

一屋子专业演员，愣是演不过一个跨界说相声的，难怪观众不买账

暖心萌阿菇凉

2026-05-06 19:44:17

赖清德窜访团集体向非洲王室蹲跪献礼，台网友讽刺其“出访”靠“偷渡”，“参见”靠“下跪”

赖清德窜访团集体向非洲王室蹲跪献礼，台网友讽刺其“出访”靠“偷渡”，“参见”靠“下跪”

极目新闻

2026-05-07 07:33:33

彭加木失踪确为神秘事件！知情人：他同事被调到安全厅，待遇很高

彭加木失踪确为神秘事件！知情人：他同事被调到安全厅，待遇很高

兴趣知识

2026-05-07 00:51:25

“最美丈母娘”沈丹萍：女儿婚房仅40平米，她处处替女婿家着想

“最美丈母娘”沈丹萍：女儿婚房仅40平米，她处处替女婿家着想

细品名人

2026-05-02 05:59:32

两江总督的两江具体所指哪里？两广总督？湖广总督是否涵盖广东

两江总督的两江具体所指哪里？两广总督？湖广总督是否涵盖广东

鹤羽说个事

2026-05-05 22:50:44

俩11、12岁女孩五一失联，惨遭熟人亲属杀害，手段残忍令人发指

俩11、12岁女孩五一失联，惨遭熟人亲属杀害，手段残忍令人发指

老猫观点

2026-05-06 18:57:19

深圳女环卫工遭男子当街殴打、拖拽倒地！只因劝阻违规，警方已介入

深圳女环卫工遭男子当街殴打、拖拽倒地！只因劝阻违规，警方已介入

南方都市报

2026-05-06 22:57:39

侯友宜正式向大陆摊牌：将统一模式强加于台湾人，主流民意不接受

侯友宜正式向大陆摊牌：将统一模式强加于台湾人，主流民意不接受

杰丝聊古今

2026-05-06 14:10:21

小学生赴俄庆祝胜利日一文让有的人不安了？

小学生赴俄庆祝胜利日一文让有的人不安了？

名人苟或

2026-05-06 12:51:00

别再吹捧神仙友情！郭富城张学友为草蜢站台，实则是乐坛顶尖艺人的生存认证

别再吹捧神仙友情！郭富城张学友为草蜢站台，实则是乐坛顶尖艺人的生存认证

草莓解说体育

2026-05-07 08:18:34

高速免费大改账：没了节假日全免，换3000公里随便跑，是赚是亏？

高速免费大改账：没了节假日全免，换3000公里随便跑，是赚是亏？

娱乐圈的笔娱君

2026-05-06 05:47:30

全网蹲好价的野生捕手，算力与羊毛都不可辜负。

2192文章数 19关注度

往期回顾全部

科技要闻

凌晨突发！马斯克租22万块GPU给“死敌”

头条要闻

牛弹琴：一位特殊的客人来到北京提到一句话很关键

头条要闻

牛弹琴：一位特殊的客人来到北京提到一句话很关键

体育要闻

阿森纳巴黎会师欧冠决赛！5月31日开战

娱乐要闻

小S阿雅重返大S母校，翻看大S毕业照

财经要闻

特朗普：美伊“很有可能”达成协议

汽车要闻

从没人做到抢着做，71台概念车揭开中国汽车下一个时代

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

亲子

房产

旅游

公开课

本地新闻

用青花瓷的方式，打开西溪湿地

亲子要闻

被挂上热搜的“宝妈和女大学生之争”事件，炸出了多少傲慢的人

房产要闻

遥遥领先！这个澄迈顶流红盘，凭什么持续霸榜

旅游要闻

江西靖安：生态水库美如画

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版