萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 144|回复: 0

AI Agent是能感知环境、决策并执行动作的智能实体.从业务角度,它可长期自主运行,借助各类工具完成复杂任务

[复制链接]
发表于 2025-1-18 20:06 | 显示全部楼层 |阅读模式
作者:微信文章
AI Agent现状与发展剖析:技术、应用与未来展望



一、AI Agent概述

(一)定义与概念

AI Agent是能感知环境、决策并执行动作的智能实体。从业务角度,它可长期自主运行,借助各类工具完成复杂任务;IBM、Salesforce等组织也从不同侧重点给出定义。当前主要探讨基于大语言模型(LLM)的AI Agent,其PPA(感知 - 规划 - 行动)表达式涵盖视觉、听觉等感知,目标设定、方案生成等规划,以及工具利用、沟通合作等行动环节,每个环节蕴含丰富应用场景。

(二)爆发原因

1. 市场推动:二级市场中智能体概念股涌现,机构研报解读趋势;币圈市场AI Agent代币火爆,如GOAT、ACT等代币涨幅惊人,吸引大量关注。

2. 商业落地:众多企业和个人用户探索应用AI Agent。微软、京东云等平台用户量增长,豆包用户突破6000万,在内容创作、资料搜集等场景应用广泛。

3. 技术赋能:大语言模型技术进化,多模态、推理等技术提升其能力,新架构与工作流让智能体从内容生成迈向任务执行,解决实际问题能力增强。

4. 应用普及:智能体平台如coze、文心智能体等涌现大量用户构建的Agent,终端设备应用增多,C端用户呈指数级增长。

二、AI Agent的市场格局

(一)大公司布局

1. 国外巨头:微软发布Azure AI Agent Service等多项服务与工具;亚马逊通过Bedrock平台推出Agent功能并发布Nova系列模型;谷歌推出Gemini 2.0等模型,推动Agent技术发展;Facebook开发游戏AI,扎克伯格预测智能体数量将远超人类;Anthropic和OpenAI也在智能体产品发布与规划上动作不断。

2. 国内企业:腾讯推出“腾讯元器”等平台与应用;阿里巴巴发布AI采购智能体,升级智能助手APP;百度的文心智能体平台吸引大量企业和开发者;字节跳动发布视觉理解模型、AgentBuilder等;科大讯飞发布星火企业智能体平台并开源模型。

(二)行业应用数据

1. 医疗保健:AI辅助放射学报告生成提高关键发现检测的准确性和速度;自动执行大量临床文档任务;CT图像处理中检测准确率高,助力心脏病早期诊断。

2. 人力资源:大幅减少简历筛选时间,改进招聘流程,提供个性化学习发展机会,降低运营成本。

3. 零售:使用AI Agent的零售商在收入增长、成本降低等方面成效显著。

4. 金融:在欺诈预防、风险评估等方面发挥作用,部分金融机构运营成本降低,客户体验改善。

5. 制造业:可预测设备故障,优化生产计划调度,降低各类成本,提高工厂生产力和产品开发效率。

(三)产品与服务形态

1. 常见类型:包括聊天助手、编码助手、AI搜索等,还细分出内容生成、知识、数据分析、工具使用、Web操作、工作流助手等多种助手类型。

2. 产品通性:聊天机器人功能扩展成为综合应用类Agent;AI搜索和编码助手较为成功;C端缺乏爆款应用,B端率先受益;多数Agent基于特定知识库构建,在程序联动操作方面存在局限;智能体构建平台成为应用构建与承载关键。

(四)应用现状与挑战

1. 应用现状:处于初级阶段,类似对话机器人,但已在多行业广泛应用,尤其在中国电商、教育等行业落地显著,技术进步使其自主工作能力提升,多模态交互界面取得突破。

2. 面临挑战:交互能力局限,工程稳定性存在随机输出和异常处理问题,安全性与隐私保护面临风险,技术复杂难以预测系统行为,集成现有系统困难,用户接受度低,定制化难度大,数据依赖性强且性能质量难以保证。

三、AI Agent技术进展

(一)技术栈与生态

AI Agent技术生态已成型,构建技术不断完善。Aura Ventures和Letta的市场全景与技术栈统计展示了技术构成,Activant Capital绘制的生态系统图从技术供应商角度呈现了AI Agent生态,涵盖基本模型、多模态数据存储、工具聚合器等多个层面。

(二)大模型技术发展

大模型向多模态发展,OpenAI的o1模型开启后训练时代,推动AI Agent应用拓展。RAG技术发展迅速,出现Naive RAG、Graph RAG等多种主流技术架构,有效提升AI Agent长期记忆。

(三)技术框架与项目

1. 微软技术框架:AutoGen用于构建Agent系统;Semantic Kernel提供基线架构;Azure AI Agent Service集成多种功能;Copilot Studio支持创建自主Agent等。

2. 谷歌技术框架:Project Astra为通用AI助手原型;Multimodal Live API具备实时音视频流输入能力;Project Mariner是多步骤任务Agent等。

3. 开源与闭源项目:技术社区推出AgentGPT、FastAgency等众多开源项目,也存在大量闭源项目,共同推动AI Agent技术发展。

四、AI Agent发展趋势

(一)采用率显著增加

Capgemini报告显示多数组织计划集成AI Agent,德勤预测使用GenAI的企业部署Agent数量将增长,Gartner预计日常工作决策中Agent参与度将提高,各行业将出现更多专业领域的AI Agent 。

(二)多模态Agent增强体验

多模态Agent可处理多种输入数据,在医疗保健、零售、创意产业等领域应用广泛,能提供更准确诊断、增强购物体验、生成个性化营销内容,紧密反映人类认知过程。

(三)多Agent系统流行

企业对复杂解决方案需求增加,多Agent系统将相互协作,处理跨部门工作流程。OpenAI Swarm和Microsoft的Magentic AI等编排平台将助力企业部署和管理多Agent系统。

(四)Agent集群与网络形成

AI Agent将进一步协作,个人和组织拥有定制Agent,通过Agent平台协同工作,重新定义生产力和问题解决能力。

(五)垂直AI Agent崛起

垂直AI Agent专注特定行业,具有专业化和定制化优势,市场规模有望远超SaaS市场,在医疗、金融等领域应用前景广阔,如IBM Watson for Oncology和自动交易系统。

AI Agent已在多方面取得显著进展并展现巨大潜力,尽管面临诸多挑战,但随着技术的不断进步和应用的深入拓展,其将在未来5年内深刻改变人们的生活,各行业应积极拥抱这一技术变革,把握发展机遇。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-1-19 01:37 , Processed in 0.055691 second(s), 16 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表