发票报销这件事,本质上跟考古差不多——你得从一张皱巴巴的纸里,挖出日期、金额、商家名,再手动填进Excel。微软工程师Anton Putra最近受够了这套流程,决定用Python和Azure Functions搞个全自动的。
他选了Azure的Document Intelligence服务,号称能识别印刷体和手写体。2天搭完原型,本地测试跑得顺顺当当,上传PDF返回JSON,字段解析准确率看着还行。问题出在部署环节——Azure Functions的冷启动把体验拖成了幻灯片,第一次调用要等5到8秒,「用户上传发票后盯着转圈,比手动填还慢」。
他试过预留实例暖机,成本直接翻三倍。最后妥协方案是加了个前端缓存,重复发票秒出结果,新发票才走完整流程。这套东西现在每天处理大概200张发票,省下的时间够他多喝几杯咖啡。
有意思的是,他GitHub仓库的README里特意标了一行:「别用免费 tier 做 demo,会社死。」
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.