八年前Meta就有万亿参数模型了——这句话是错的,但我的状态是真的。过去两年,AI成了我工作流程里最常用的工具。我用Claude写Swift,用它画架构图,用它调试代码,让它解释别人的实现。个人项目也离不开:习惯追踪器、食谱解析器,全是AI搭的。它不再是"偶尔试试"的东西,而是我伸手去拿、排在Google之前的默认选项。
但我从没停下来搞懂黑盒里到底在发生什么。
![]()
我不知道embedding究竟是什么。读过四十遍"向量数据库",却没法向初级开发解释为什么需要它。我能说出RAG、agents、fine-tuning这些词,就像一个人能报出三种法国奶酪的名字但根本没吃过。我会用AI,我不懂AI。
![]()
这在我十一年的软件工程师生涯里,是个奇怪的位置。
每隔半年,我会打开一个标签页写着"学AI",一小时内关掉。这个领域看起来像一场我已经错过的狂奔。Transformers、Attention、Embeddings、Diffusion、RLHF、LoRA、Quantization、MoE。新论文每天冒出来,新框架每周迭代,新benchmark人人知道被操纵,新"agents"不过是while True: call_llm()换了个包装。继续用AI比学它容易多了。
我给自己编的故事是:等尘埃落定再说。
但尘埃不会落定。尘埃就是这个领域本身。
几周前,我读了一些描述真实生产AI系统的文章——不是demo,是已上线的那种。我反复看到的不是机器学习巫术,是工程。状态机输出文本。重试逻辑。超时设置。手动管理的内存,因为上下文窗口有限。工具设计。成本预算。可观测性。评估套件。代码执行的沙箱隔离。并发控制。这问题空间我穿了十年不同戏服在打。
于是问题从"我能学会吗"变成了"为什么还没开始"。
接下来6个月,24周,从现在开始,我要正经学这个。公开学,在dev.to上写。
![]()
这篇是第0周。之后每个周日发一篇:我做了什么,搞坏了什么,什么让我意外,什么我会换种做法。带代码,带仓库,带错误转弯——因为错误转弯才是唯一真正教东西的部分。
公开做只有一个原因:私下写可以让你悄悄 quit,公开写让 quit 变成一个你得讲出来的故事。
给自己定的几条原则:先走难路再走易路。原始HTTP请求先于任何SDK。玩具实现先于生产库。手写核心循环先于框架。概念图和论文先于教程。如果我不能向五年前的自己解释清楚,就不算懂。如果我不能在几小时内搭出一个能跑的东西,就不算会。
这不是要变成机器学习研究员。是要成为能看清系统全貌的工程师——从权重到API,从训练数据到生产监控。我想知道什么时候该相信模型,什么时候该怀疑它。想能在白板上画出数据怎么流进去、怎么变出来。
第1周从embedding开始。真正的embedding,不是"高维向量"这种废话。我要实现一个能跑的版本,看数字怎么变成意义,看相似性怎么被计算。
如果你也在用AI但不懂它,欢迎一起来。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.