新闻 发表于 2025-11-25 15:00

创新工作室开课啦!第17弹 | 什么是AI智能体(Agent)?给AI装上“手和脚”

作者:微信文章




AI大模型小课堂

第17期

什么是AI智能体(Agent)?给AI装上“手和脚”



传统的语言模型是一个被动的“文本生成器”,你问一句,它答一句。而AI智能体(Agent)则是一个主动的“任务执行者”。它以大语言模型为“大脑”,不仅能理解你的意图,还能自主地规划步骤、使用工具,像一个真正的助理一样去完成任务。

01

从“语言模型”到“智能体”



一个基本的语言模型(LLM)只能访问其内部的知识。而一个AI智能体,则被赋予了“手和脚”——也就是使用外部工具的能力。

大模型作为控制器

(LLM as Controller)

在Agent架构中,LLM扮演着核心“大脑”或“控制器”的角色。它负责理解用户的高层目标,并将其分解成一系列可执行的步骤。

工具使用(Tool Use)

这是Agent与世界互动的关键。所谓的“工具”,可以是任何能够被调用的外部功能,例如:

API调用(API Calling): 查询天气、搜索网页、预订酒店、发送邮件等。

代码执行器: 运行Python代码来进行复杂的计算或数据分析。

数据库查询: 从数据库中获取实时数据。

其他模型: 调用一个专门的文生图模型来画一张画。

02

Agent的工作循环



一个典型的AI智能体通常遵循一个“思考-行动”的循环:

思考 (Thought)

基于用户的指令和当前情况,LLM大脑进行“思考”,判断下一步应该做什么。

行动 (Action)

根据思考结果,决定调用哪一个“工具”,以及如何设置工具的参数。

观察 (Observation)

执行工具后,系统会返回一个结果(例如,API的返回数据、代码的运行输出)。这个结果就是Agent的“观察”。

重复

Agent将这个“观察”结果作为新的信息,再次进入“思考”环节,规划下一步的“行动”,如此循环,直到最终任务完成。

03

规划 (Planning)



对于复杂任务,Agent需要具备规划能力。LLM大脑需要能够将一个模糊的、宏大的目标(例如,“帮我规划一次巴黎的周末旅行”)分解成一系列具体的、有序的子任务(查询航班 -> 查询酒店 -> 查找景点 -> 制定行程表),然后一步步地调用工具去执行。

总结



AI智能体(Agent)是将大语言模型的推理能力与外部工具的执行能力相结合的强大范式。通过赋予LLM“手和脚”,我们让它从一个只能“说”的“大脑”,进化成一个能够“做”的、可以自主完成复杂任务的“智能助理”,这是通往更通用人工智能的重要一步。

供稿|未来交通工程院冯瑞奇

编辑|陶全桧

责编|谭屈山

审核|熊萧然

转载或引用请联系授权

页: [1]
查看完整版本: 创新工作室开课啦!第17弹 | 什么是AI智能体(Agent)?给AI装上“手和脚”