网易首页 > 网易号 > 正文 申请入驻

写给技术负责人的Agentic AI术语手册

0
分享至

每个开发者都在用AI工具,但很少有人能说清楚背后的概念。Transformer到底在哪一层?MCP解决了什么问题?"智能体AI"是真技术还是聊天机器人的新包装?

这篇文章把机器学习到智能体的完整技术栈梳理成一份速查手册,从token、记忆、工具到RAG和向量数据库,按层级组织。适合遇到模糊概念时直接跳转查阅,而非通读。


基础层:机器学习


传统编程是你写规则:"如果邮件主题包含'免费赚钱',标记为垃圾邮件。"机器学习把这个逻辑颠倒过来——程序通过试错自己发现规则。你给它几千封标注"垃圾"或"正常"的邮件,程序对每封邮件猜测标签,对比正确答案,然后调整内部参数(权重)让错误少一点。重复数百万次后,这些权重会收敛成有用的模式。

权重长什么样?想象垃圾邮件检测器给每封邮件打分:看到"viagra"加0.8分,发件人未知加0.5分,感叹号多加0.2分。总分超过阈值就判为垃圾邮件。这些数字就是权重,训练就是找出每个数字该是多少。

训练产出不是代码,而是模型文件——存储所有权重。简单垃圾过滤器可能有数千个权重,大语言模型有数十亿个。把新邮件输入模型,它输出判断:垃圾或正常。

技术栈层级

几个关键区分:

• AI是最宽泛的领域——机器做任何我们称之为智能的事
• 机器学习是AI的子集:从数据中学习模式,而非显式编程
• 深度学习是ML的子集,使用多层神经网络
• 大语言模型是深度学习的具体应用,基于2017年提出的Transformer架构

所以层级关系是:LLM ⊂ 深度学习 ⊂ ML ⊂ AI。Claude、ChatGPT、Gemini、Llama都是LLM。

这些术语常被混用,但本质不同。垃圾过滤器和ChatGPT都是AI、都是ML,但只有一个是LLM。

神经网络与深度学习

神经网络是一种特定的ML算法,松散借鉴大脑结构:多层节点互相连接,每条连接携带一个权重。输入从一侧进入,流经各层,预测从另一侧输出。节点本身很简单,通常是"加权求和输入,如果超过阈值就激活"。

深度学习的"深度"指层数。2012年的突破是证明多层网络(当时8层就算深)在图像识别上远超传统方法。今天的网络可能有数百层。

层数增加带来两个问题:计算量爆炸,以及梯度消失(前面层的权重几乎不更新)。反向传播算法解决了后者,GPU解决了前者。

Transformer架构

2017年Google论文《Attention Is All You Need》提出了Transformer,成为现代LLM的基础。核心创新是自注意力机制:处理序列中每个元素时,模型能"看"到序列中所有其他位置,并决定关注哪些。

之前的RNN(循环神经网络)像阅读时只能记住前面几个词,Transformer像能随时翻回任意页。这让并行计算成为可能,训练速度大幅提升。

Transformer由编码器和解码器组成。编码器把输入转换成内部表示,解码器生成输出。GPT系列只用解码器,BERT只用编码器,T5两者都用。

Token与嵌入

模型不直接处理文字,而是token——可以是单词、子词或字符。GPT-4用BPE(字节对编码)分词,"unhappiness"可能被拆成"un"、"happiness"两个token。

每个token对应一个高维向量(嵌入),捕捉语义关系。训练后,相似词在向量空间中距离近:"king"减"man"加"woman"约等于"queen"。

上下文窗口指模型一次能处理的token数。GPT-3是2048,GPT-4是128K,Claude 3是200K。窗口越大,模型能"记住"的上下文越多。

训练三阶段

预训练:在海量文本上预测下一个token,学习语言结构和世界知识。需要数千GPU运行数月,成本数千万美元。

微调:在特定任务数据上调整模型,让它更擅长某项工作。比预训练便宜得多。


RLHF(人类反馈强化学习):让模型输出更符合人类偏好。收集人类对多个回答的排序,训练奖励模型,再用强化学习优化策略。

推理与生成

训练好的模型用于推理时,每次生成一个token。输入"今天天气",模型计算每个可能下一个token的概率,选择"很"、"不错"、"晴朗"等之一,通常用温度参数控制随机性:低温更确定,高温更多样。

贪婪解码总是选概率最高的token,束搜索保留多个候选序列,核采样(top-p)从累积概率达阈值的子集中选择。

智能体层:从预测到行动

基础LLM只是预测下一个token。智能体AI给模型加上三样东西:工具(调用API、查数据库、执行代码)、记忆(记住对话历史或长期知识)、规划(把复杂任务拆成步骤)。

ReAct模式(推理+行动)让模型交替思考"我需要什么信息"和执行工具调用。看到"巴黎天气如何",模型可能先调用天气API,拿到结果后再组织回答。

RAG与向量数据库

检索增强生成解决LLM知识截止和幻觉问题。流程:用户提问→把问题转成向量→在向量数据库找最相似的文档片段→把检索结果塞进提示词→模型基于这些上下文回答。

向量数据库专门存储高维向量并快速找最近邻。嵌入模型把文本转成向量,相似语义在空间中距离近。常用方案:OpenAI的text-embedding-ada-002,开源的sentence-transformers。

MCP:工具连接标准

模型上下文协议(Model Context Protocol)是Anthropic提出的开放标准,解决"每个AI工具都要单独写连接器"的问题。MCP把数据源或工具包装成标准接口,任何支持MCP的客户端都能调用。

类似USB-C统一充电口,MCP希望统一AI与外部系统的连接方式。服务器暴露资源(只读数据)、工具(可执行函数)、提示词(预定义模板)三种能力。

记忆机制

对话历史是短期记忆,直接放在上下文窗口里。长期记忆需要外部存储:摘要过去对话、存储关键事实到数据库、或用向量检索相关记忆。

一些实现让模型主动决定"这件事值得记住",写入长期存储;需要时检索"用户之前提过喜欢日式咖啡"。

评估与观测

智能体系统难调试,因为输出不确定且依赖外部工具。关键指标:任务完成率、步骤效率(用了多少步)、成本、延迟。需要记录完整执行轨迹,才能复盘"为什么这次调用错了API"。

LangSmith、Weights & Biases等工具提供追踪和评估框架。对抗测试故意给模糊指令或错误工具返回值,检验系统鲁棒性。

从概念到落地

这份术语手册的价值不在一次性读完,而在遇到具体问题时快速定位。搞不清RAG和微调的区别?跳到对应章节。MCP和Function Calling什么关系?看工具连接部分。

技术栈还在快速演变,但这些基础概念相对稳定。理解它们之间的层级关系,比记住每个新名词更重要。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他们给得太多了!37岁莱万拒与巴萨续约 转投C罗死敌:年薪7亿元

他们给得太多了!37岁莱万拒与巴萨续约 转投C罗死敌:年薪7亿元

风过乡
2026-05-14 06:30:19
45万“买”烟草局编制?诈骗人员伙同物业员工,带人进成都市烟草局会议室“面试”,两年多时间里诈骗36人获利874万,主犯获刑13年6个月

45万“买”烟草局编制?诈骗人员伙同物业员工,带人进成都市烟草局会议室“面试”,两年多时间里诈骗36人获利874万,主犯获刑13年6个月

扬子晚报
2026-05-14 07:28:52
马斯克发帖炫耀:只有黄仁勋我们两个在空军一号上

马斯克发帖炫耀:只有黄仁勋我们两个在空军一号上

微微热评
2026-05-13 22:30:04
大连女子带狗撸串事件再升级!正脸全曝光竟是惯犯,店铺惨遭停业

大连女子带狗撸串事件再升级!正脸全曝光竟是惯犯,店铺惨遭停业

奇思妙想草叶君
2026-05-13 21:13:03
长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

揽星河的笔记
2026-05-13 13:26:24
孙颖莎夺冠第一个抱住的人,不是马琳不是邱贻可,而是当陪练的她

孙颖莎夺冠第一个抱住的人,不是马琳不是邱贻可,而是当陪练的她

白面书誏
2026-05-13 17:25:06
最后时刻,黄仁勋挤上飞向北京的“空军一号”

最后时刻,黄仁勋挤上飞向北京的“空军一号”

中国新闻周刊
2026-05-13 20:56:03
没错,我就是“基本盘”

没错,我就是“基本盘”

星空区块链
2026-05-13 13:12:12
你的蓝牙耳机可能在“窃听”!国安部提醒涉密人员禁止使用,苹果、华为、小米、索尼等品牌客服回应

你的蓝牙耳机可能在“窃听”!国安部提醒涉密人员禁止使用,苹果、华为、小米、索尼等品牌客服回应

都市快报橙柿互动
2026-05-14 00:46:18
4分钟干倒十年烧烤店:大连“撸串姐”凭一己之力,让全网破防了

4分钟干倒十年烧烤店:大连“撸串姐”凭一己之力,让全网破防了

奇思妙想草叶君
2026-05-13 18:20:11
重磅!国家正式出手!不生孩子的时代要结束了?

重磅!国家正式出手!不生孩子的时代要结束了?

一口娱乐
2026-05-13 18:11:47
拼命演戏还清一亿四千万巨债,豪门梦碎,现回浙江农村过踏实日子

拼命演戏还清一亿四千万巨债,豪门梦碎,现回浙江农村过踏实日子

萧狡科普解说
2026-05-14 04:44:16
花旗将获中国第七张外商独资券商牌照

花旗将获中国第七张外商独资券商牌照

风向观察
2026-05-14 08:46:29
江苏4个县市区党政“一把手”调整

江苏4个县市区党政“一把手”调整

上观新闻
2026-05-14 06:48:29
日本乒协没想到,世乒赛惨败中国队后,最先扛不住的,是张本智和

日本乒协没想到,世乒赛惨败中国队后,最先扛不住的,是张本智和

揽星河的笔记
2026-05-13 20:40:58
特朗普访华,不按常规出牌,带上了国防部长,我外交部一句话亮了

特朗普访华,不按常规出牌,带上了国防部长,我外交部一句话亮了

共工之锚
2026-05-14 00:09:41
“67岁产女妈妈卧床” 老伴回应:系半月前在老家突发脑梗 女儿今年将上小学

“67岁产女妈妈卧床” 老伴回应:系半月前在老家突发脑梗 女儿今年将上小学

红星新闻
2026-05-13 13:54:49
专机落地!特朗普又舞起熟悉手势 乘专车前往酒店

专机落地!特朗普又舞起熟悉手势 乘专车前往酒店

看看新闻Knews
2026-05-13 23:14:07
被姚明抱着上奥运的抗震小英雄,曾发誓考上清华,18年后成了这样

被姚明抱着上奥运的抗震小英雄,曾发誓考上清华,18年后成了这样

云舟史策
2026-05-13 07:17:23
重磅!皇马与穆帅敲定3年执教合同!只待本菲卡赛季结束后,官宣

重磅!皇马与穆帅敲定3年执教合同!只待本菲卡赛季结束后,官宣

福酱的小时光
2026-05-14 06:27:54
2026-05-14 09:08:49
算力游侠
算力游侠
游走在API与报错之间,用魔法(AI)打败魔法的非硬核玩家。
2693文章数 23关注度
往期回顾 全部

科技要闻

马斯克:只有我和黄仁勋坐上了"空军一号"

头条要闻

专机落地特朗普又舞起熟悉手势 乘专车前往酒店

头条要闻

专机落地特朗普又舞起熟悉手势 乘专车前往酒店

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

片仔癀依旧困在“片仔癀”

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

家居
本地
数码
教育
房产

家居要闻

内在自叙,无域有方

本地新闻

用苏绣的方式,打开江西婺源

数码要闻

苹果MacBook Neo被同价位Windows笔记本“碾压”

教育要闻

今年中考改革力度大,多省份普高扩招,科目缩减,河南有哪些变化

房产要闻

卷疯了!最低杀到7字头!手握30万,海口楼市横着走!

无障碍浏览 进入关怀版