从手写账本到电子表格——数据收集与清洗
阿杰的第一步,是处理六叔公那一堆手写账本。潦草的字迹、漏记的日期、不一致的计量单位(有时用“斤”,有时用“只”)……这就是典型的“脏数据”。
![]()
他花了几天时间,把所有历史数据录入到Excel表格里。列包括:日期、烧鸭销量、叉烧销量、白切鸡销量、成本、营业额、天气情况(阿杰后来补上的)等。
“爷爷,你看,”阿杰指着屏幕说,“我们把混乱的‘原材料’(原始数据)整理干净,就像您处理食材一样,去掉不好的部分,才能做出好菜。”高质量的分析,必然建立在干净、规整的数据之上。 六叔公看着清晰的表格,第一次觉得这些数字似乎没那么陌生了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.