现在AI概念层出不穷,让人眼花缭乱,但其中很多是吹出来的,并没有看上去那么玄。
相对的也有一些很重要的概念,被劣币淹没让初学者找不到重点以至于一头雾水。
今天花几分钟给大家简单科普一下,看完你就全懂了,稍微花点心思自己也能搭出一个Agent。
为了方便好记,我们给现在正火的Openclaw龙虾机器人加一个S,变成OpenCLAWS。
让它代表Open-source Context-aware Large Language Model Agent with Workflow and System prompt and function calling。
于是这个缩写就包含了所有智能体的重要概念。
Open-source指的是开源,让普通人手搭Agent成为可能。
Context-aware指的是智能体能识别上下文,有记性。
后面的LLM是大语言模型。
Agent指的就是智能体。
with Workflow是指这个助手可以通过LLM理解和拆解任务,最后生成一个可执行的工作流。
System prompt是指系统提示词,也就是给提示词做了规范。
没有这玩意Agent会胡思乱想乱调用工具,有了之后就老实多了,只能按规范来。
智能体的脑子是LLM,也就是大语言模型,它能读懂你说的话,也能写出你能看懂的话,当然也可以写代码跟机器沟通。
核心原理很简单,之前也讲过,本质就是猜下一个词。
先把文本拆成Token词元,也就是LLM处理文本的最小单位,可理解为拆分后的单个字、词或词根。
然后转成向量,靠Self-Attention Mechanism自注意力机制关联,再通过解码器生成连贯回复。
运转自注意力机制的是Transformer变换器,GPT的缩写就是Generative Pre-trained Transformer。
以往的语言处理模型包括RNN循环神经网络,以及LSTM长短期记忆网络,采用的方式是一个一个字读,没法关注到一段话里的所有信息,理解能力堪忧。
而自注意力机制可以给一段话里面不同的字分配权重,于是一下子就可以看懂全局。
那为啥叫大语言模型呢?
因为Parameters,也就是参数多。
你可以把这些参数理解为是LLM的知识储备,参数量越大,知识越丰富,能读懂的越多,也越能说明白话。
不过LLM只是个脑袋,能听能思考能说,但也就只能动动嘴,因为没有手。
例如我想让LLM做个PPT,需要自己跟他对话输入提示词,让它根据要求一页一页写出来,我再人工拷进PPT。
如果有个东西能把拷贝这个步骤省了,直接给我生成PPT不就爽了吗?
这就是智能体的Function Calling功能,它能调用工具。
既然可以调用本地工具,自然也可以在本地检索并调用本地数据和文档,这就是RAG,Retrieval-Augmented Generation,检索增强型生成。
检索就需要目录,目录叫做Embedding嵌入式词向量,说白了就是把本地数据库里面的文字转换为一串数字,大模型按数字表达可以找到这段文字,也就找到了知识点。
能调用本地自然也可以去网上检索,这个功能早就有,这里就不多说了。
既然Agent可以自己调用工具,自己检索数据,那如果能把我给的任务拆解成子任务,再一个个执行,岂不完美了?
这就是Workflow工作流,让LLM帮你把任务拆解成工作流,再由智能体执行。
这个过程叫Task Planning,智能体将复杂目标拆解为可执行的子任务,定义子任务优先级和执行顺序的能力。
让智能体有思路。
从此AI就不再只是耍嘴皮子,还能动手,就像龙虾的大钳子claw,所以最初这个智能体叫clawbot。
捋下来你会发现,所有这些看似神乎其神的东西,其实是一个自然演化的过程。
设想并实现这些需求都是自然而然的事情,那么真正的难点在哪呢?
其实在于接口。
智能体需要调用本地工具和本地数据,那就需要定义好对工具和操作系统的接口规范。
而且很多时候智能体不止有一个脑子,除了LLM之外还有,VLM视觉语言,MLM多模态,ASR语音识别,TTS语音合成,以及最近最火的Seedance2.0这种VGM视频生成模型。
这些模型之间也需要交互,那就也需要接口规范。
于是MCP诞生了,全称Model Context Protocol模型上下文协议。
由Claude母公司Anthropic提出,目的就是给AI世界定义一个TypeC接口,让LLM可以调用其他模型以及操作系统和工具。
随着这套规范逐渐成熟,大家都开始基于这套规范定义接口,智能体会迎来一个大爆发时代。
5年内50%的岗位会被智能体取代,10年内只有10%的人幸存。
至于那时被裁员了还能做什么,我在另一篇文章中讲过,就不再重复了。
评论区留给大家见仁见智吧。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.