用了两年AI，我决定从零开始学|向量|代码|上下文|新论文

用了两年AI，我决定从零开始学

2026-05-16 03:51:00　来源: 固件更新中

北京举报

分享至

八年前Meta就有万亿参数模型了——这句话是错的，但我的状态是真的。过去两年，AI成了我工作流程里最常用的工具。我用Claude写Swift，用它画架构图，用它调试代码，让它解释别人的实现。个人项目也离不开：习惯追踪器、食谱解析器，全是AI搭的。它不再是"偶尔试试"的东西，而是我伸手去拿、排在Google之前的默认选项。

但我从没停下来搞懂黑盒里到底在发生什么。

我不知道embedding究竟是什么。读过四十遍"向量数据库"，却没法向初级开发解释为什么需要它。我能说出RAG、agents、fine-tuning这些词，就像一个人能报出三种法国奶酪的名字但根本没吃过。我会用AI，我不懂AI。

这在我十一年的软件工程师生涯里，是个奇怪的位置。

每隔半年，我会打开一个标签页写着"学AI"，一小时内关掉。这个领域看起来像一场我已经错过的狂奔。Transformers、Attention、Embeddings、Diffusion、RLHF、LoRA、Quantization、MoE。新论文每天冒出来，新框架每周迭代，新benchmark人人知道被操纵，新"agents"不过是while True: call_llm()换了个包装。继续用AI比学它容易多了。

我给自己编的故事是：等尘埃落定再说。

但尘埃不会落定。尘埃就是这个领域本身。

几周前，我读了一些描述真实生产AI系统的文章——不是demo，是已上线的那种。我反复看到的不是机器学习巫术，是工程。状态机输出文本。重试逻辑。超时设置。手动管理的内存，因为上下文窗口有限。工具设计。成本预算。可观测性。评估套件。代码执行的沙箱隔离。并发控制。这问题空间我穿了十年不同戏服在打。

于是问题从"我能学会吗"变成了"为什么还没开始"。

接下来6个月，24周，从现在开始，我要正经学这个。公开学，在dev.to上写。

这篇是第0周。之后每个周日发一篇：我做了什么，搞坏了什么，什么让我意外，什么我会换种做法。带代码，带仓库，带错误转弯——因为错误转弯才是唯一真正教东西的部分。

公开做只有一个原因：私下写可以让你悄悄 quit，公开写让 quit 变成一个你得讲出来的故事。

给自己定的几条原则：先走难路再走易路。原始HTTP请求先于任何SDK。玩具实现先于生产库。手写核心循环先于框架。概念图和论文先于教程。如果我不能向五年前的自己解释清楚，就不算懂。如果我不能在几小时内搭出一个能跑的东西，就不算会。

这不是要变成机器学习研究员。是要成为能看清系统全貌的工程师——从权重到API，从训练数据到生产监控。我想知道什么时候该相信模型，什么时候该怀疑它。想能在白板上画出数据怎么流进去、怎么变出来。

第1周从embedding开始。真正的embedding，不是"高维向量"这种废话。我要实现一个能跑的版本，看数字怎么变成意义，看相似性怎么被计算。

如果你也在用AI但不懂它，欢迎一起来。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.