|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
x
作者:微信文章
我对AI Agent这个东西非常反感,反感到听到这个词就觉得是在搞诈骗,因为AI Agent 100个人有100个解释,更加解释不清楚AI Agent和AI APP是个啥区别。
甚至搞不清楚自己在做AI Agent,还是AI APP,如果认为自己是在做AI Agent,那么AI APP似乎就只是个前端页面?
如果业务视角交付的是AI APP,那么又何必大炒AI Agent这个概念,谁家在讲OA系统的故事时候会到处给人说自己在MySQL创建了一张表?
扯来扯去似乎就变成了,AI APP就等于AI Agent,造AI 应用,就是在造AI Agent,事实上的工作内容真的是这样吗?
对于实施方来说,重要的是脚踏实地的稳步前进,如果要炒概念讲业务故事,就老老实实的说应用,如果是搞技术的,就老老实实的去做Agent,非要把两者混为一谈。
似乎交付业务价值就是在交付AI Agent,但是又没法圆AI APP这个概念,于是就干脆把两者等价算了,这,是忽悠的表现。
在不少大忽悠的大V的热点文章中,把AI Agent称为大模型落地的最后一公里,且非常深奥的抽象出了Agent的落地架构:
包含规划(Planning)、记忆(Memory)、工具(Tools)、执行(Action)四大要素。
然后还费劲的做了非常高深的解释:
第一,感知环境。首先,AI Agent需要收集环境信息,可以使用传感器或从各种来源收集数据。
第二,处理输入数据。AI Agent处理前序环节收集到的知识,这可能包括组织数据、创建知识库,或创建AI Agent可以理解和使用的内部表征。
第三,决策制定。AI Agent使用逻辑或统计分析等推理技术,基于知识库和目标做出明智的决策,可能涉及应用预先设定的规则或机器学习算法。
第四,规划和执行行动。AI Agent制定实现目标的计划或一系列步骤,可能包括创建分步策略、优化资源分配或考虑各种限制和优先事项。根据计划,AI Agent执行所有步骤以实现预期目标。AI Agent还可以从环境中接收反馈或新信息,用于调整未来的行动或更新知识库。
第五,学习和改进。在采取行动后,AI Agent可以从经验中进行学习,通过反馈循环提高AI Agent的性能,并适应新的情况和环境。
这架构有问题吗?没问题,但是这哪是最后一公里,这简直就是二万五千里长征刚起步,遵义会议都还没开。。
甚至曾经的各种XX中台在这个要素下都得叫声哥。。。
在理解什么是AI Agent,以及什么是AI APP的时候,首先需要罗列清楚一个基于大模型去实现的应用,到底是一个什么样的工作流,而那些讲不清AI Agent的人,大概率就是做了个hello world就开始上路。。
如果是做一个demo,基于大模型的应用基本上会有如下流程:
用户上传个PDF
后端接收PDF并且做文本提取等操作
基于预设prompt与大模型对话
适当引入些COT类似的机制,多次思考再反复与大模型对话,确保答案符合预期,这个过程可能会用到一些工具。
后端组装结果,返回结果给页面
在这个过程中,大部分忽悠师傅把 2, 3, 4 全部囊括在Agent的范畴内,且做出了一些所谓的平台只需要在页面点点点就能完成:上传文件,与大模型对话 这件事。
然后就衍生出了前面的一系列Agent的高深定义,看起来似乎很合理?
那么如果是做一个生产应用呢?它会有如下流程:
1. 用户往数据平台上传1万个PDF,每个PDF 1个GB。
2. 采用 Spark或者Ray框架,对每个PDF进行加工处理,必要的时候会做向量化。
3. 在元数据管理系统构建整套非结构化数据的信息。
4. 做一个前端页面支持用户对话,对话的时候可以选择文件(而非直接上传)。
5. 后端接收用户输入的请求。
6. 基于预设prompt与大模型对话。
7. 适当引入些COT类似的机制,多次思考再反复与大模型对话,确保答案符合预期,这个过程可能会用到一些工具。
8. 后端组装结果,返回结果给页面。
那么在这个环节中,Agent应该包含哪几步呢?包含1和2吗?如果不包含,那么典型和那一套深奥的范围对不上,如果包含,那岂不是整个数据平台都可以叫Agent了?
反而这样一拆解之后,其实结论已经非常清晰了,Agent仅仅只是构建大模型应用中的一个非常细微的步骤,甚至都不是必须的步骤,比如:
微调了一个垂直模型,直接问答就能得到完全符合预期的答案。
那么基于这个模型只需要做一个非常简单的前后端,什么所谓的AI Agent框架都可以不要,这算不算AI APP?和Agent有关系吗?
所以从概念上来说,开发一个 XXX助手的描述 明显 是合理的,而 开发一个XXX Agent 明显是个骗子。
这就像 开发一个小程序的官网 听起来 就很合理,但是 开发一个小程序官网的数据库表结构 听起来是不是很不对劲?
因为小程序官网才是真正的业务,而创建数据库的表,只是完成这个官网开发中间的一个步骤,甚至都不是必须的,万一是个静态页面呢?
AI Agent不是筐,不能什么都往里装,老老实实去搞 AI 应用,不要造一些稀奇古怪的概念,反而让人很难理解。 |
|