找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 266|回复: 0

AI的财富竞赛(2)

[复制链接]
发表于 2025-10-3 06:25 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
三、构建自主智能体的核心模块(二)关键技术支撑

    大模型增强GPT-4、Gemini 2.0 等大模型为 Agentic AI 提供了强大的上下文理解与逻辑推理基础。在自然语言处理任务中,GPT-4 能够理解复杂的语义和语境,当用户提出模糊或隐喻性的问题时,它能通过对上下文的分析和推理,准确把握用户意图。例如,用户询问 “那个像苹果一样的东西是什么,但不是水果”,GPT-4 可以通过对 “像苹果但不是水果” 这一描述的理解,推测用户可能指的是苹果公司的产品,如 iPhone 或 MacBook 等,从而给出准确的回答。Gemini 2.0 在多模态处理方面表现出色,它可以同时处理图像和文本信息,当输入一张包含文字和物体的图片,并提问相关问题时,Gemini 2.0 能够结合图像中的视觉信息和文字信息进行分析,给出全面的回答,为 Agentic AI 在复杂任务中的语义解析提供了有力支持。
    规划算法强化学习(RL)与分层任务规划(HTP)相结合的规划算法,有效解决了长序列依赖问题。以 AutoGLM 的跨应用流程编排为例,在实现全自动点外卖的过程中,首先利用强化学习算法,让 Agent 在模拟的点外卖环境中不断尝试不同的操作序列,如选择餐厅、挑选菜品、填写地址、选择支付方式等,根据每次操作的结果获得奖励反馈,逐步学习到最优的操作策略。同时,采用分层任务规划,将点外卖这一复杂任务分解为多个层次的子任务,如 “选择餐厅” 子任务又可以进一步分解为 “根据口味偏好筛选餐厅”“查看餐厅评价” 等更细粒度的子任务。通过这种方式,AutoGLM 能够有条不紊地完成跨应用的复杂流程编排,实现高效的任务执行。
    安全沙箱在 Agentic AI 执行代码时,安全沙箱至关重要,PPIO 沙箱是其中的典型代表。它通过实现环境隔离,为 Agentic AI 提供了一个安全的执行空间。在这个空间内,Agentic AI 的代码执行与外部系统完全隔离,防止了数据泄露,避免了 Agentic AI 在执行过程中获取或泄露敏感数据。同时,也有效防止了资源抢占,避免因 Agentic AI 的过度资源占用导致系统崩溃或其他服务无法正常运行,保障了系统的稳定性和安全性。

w1.jpg
四、技术突破与产业生态构建

(一)技术演进驱动因素

    大模型性能跃升近年来,大模型性能取得了令人瞩目的突破,其中上下文窗口扩展和推理能力提升尤为显著。以 GPT-4 为例,其支持高达 8K tokens 的上下文窗口,这意味着它能够处理更长、更复杂的文本内容。在实际应用中,当处理一篇长篇学术论文时,GPT-4 可以一次性读取大量文本信息,理解论文的整体结构和核心观点,而不会因上下文信息不足导致理解偏差。同时,大模型的推理能力也得到了极大提升,能够处理多步任务规划。在解决数学问题时,它不再局限于简单的计算,而是可以通过逻辑推理,规划出解决复杂数学问题的步骤,如先分析问题类型,再选择合适的公式和方法,逐步推导得出答案,为 Agentic AI 实现复杂任务的自主处理提供了坚实的基础。
    成本优化根据斯坦福报告显示,在 2023-2025 年期间,AI 推理成本出现了惊人的下降,达到了约 280 倍。这一成本的大幅降低,使得 Agentic AI 的规模化部署成为可能。在过去,高昂的推理成本限制了许多企业对 AI 技术的应用,尤其是中小企业,往往因无法承担高昂的成本而望而却步。如今,随着推理成本的降低,中小企业也能够负担起 Agentic AI 的基础应用。例如,一些小型电商企业可以利用 Agentic AI 实现智能客服、库存管理等功能,通过自动化的服务和管理,提高运营效率,降低人力成本,从而在激烈的市场竞争中获得更大的优势。
    协议标准化模型上下文协议(MCP)与智能体协作协议(A2A)的出现,为 Agentic AI 系统的交互带来了极大的便利。MCP 协议由 Anthropic 于 2024 年 11 月推出,它通过标准化接口,实现 AI 模型与外部资源(如数据库、API、文件系统等)的无缝集成,就像为 AI 系统提供了一个通用的 “USB 接口”,使 AI 模型能够方便地调用外部工具 。A2A 协议则是谷歌在 2025 年 4 月初开源的一项开放协议,它集合了众多知名技术公司的意见,主要解决不同智能体之间的任务交换、状态共享、异步协作等问题,为不同智能体提供了一门 “通用语言” 和统一的 “通信标准”。亚马逊云科技、谷歌等科技巨头纷纷通过这些统一接口,加速生态整合。例如,在谷歌的智能办公生态中,不同的智能体可以通过 A2A 协议进行协作,共同完成复杂的办公任务,如文档处理、会议安排等;而在亚马逊云科技的电商服务中,MCP 协议使得 AI 模型能够快速连接到各类电商工具和数据资源,实现商品推荐、订单处理等功能的自动化,大大提高了服务效率和用户体验。
(二)产业布局与代表案例

    科技巨头布局科技巨头们在 Agentic AI 领域展现出了强大的技术实力和前瞻性的布局。谷歌推出的 Gemini 2.0 专用大模型,为其在 Agentic AI 领域的发展提供了强大的技术支持。基于 Gemini 2.0 打造的 Mariner 智能体,在电商和办公场景中展现出了卓越的自动化能力。在电商场景中,Mariner 能够理解用户的购物需求,自主浏览各大电商平台,搜索符合用户需求的商品,并进行筛选和比较,将最适合的商品推荐给用户,甚至可以完成下单和支付等操作。在办公场景中,它可以自动处理邮件、安排会议、生成文档等,大大提高了办公效率。英伟达则构建了 Agentic AI 开发框架,该框架支持从感知到执行的全流程工具链。在自动驾驶领域,基于英伟达开发框架的智能体可以通过传感器感知周围环境信息,如道路状况、车辆位置等,然后进行推理和决策,规划行驶路径,并控制车辆的加速、减速、转向等操作,实现自动驾驶的全流程自动化。
    创新企业突破国内的创新企业在 Agentic AI 领域也取得了显著的突破。PPIO 发布了国内首个 Agentic AI 基础设施平台,该平台提供 “大脑 + 手脚” 全栈服务。它不仅具备强大的智能决策能力,还能够通过与各种硬件设备的连接,实现实际的操作执行。在工业制造领域,PPIO 的 Agentic AI 平台可以连接生产线上的各种设备,根据生产计划和实时数据,自动调度设备运行,优化生产流程,提高生产效率和产品质量。智谱 AI 的 AutoGLM 则实现了超 50 步长流程操作,开启了 “全自动上网” 时代。用户只需提出简单的需求,如 “预订明天从北京到上海的高铁票”,AutoGLM 就能自动打开相关的应用程序,完成账号登录、车次查询、座位选择、支付等一系列复杂操作,为用户提供了极大的便利。
    开源生态活跃开源生态在 Agentic AI 的发展中发挥着重要作用,OpenManus、Dify 等项目推动了技术的普惠。OpenManus 项目为开发者提供了丰富的工具和资源,使其能够基于开源框架快速构建定制化智能体。例如,开发者可以根据自己的需求,在 OpenManus 的基础上,定制开发适用于智能家居场景的智能体,实现对家居设备的智能控制。Dify 则提供了低代码工具,即使是没有深厚编程基础的人员,也能通过简单的拖拽和配置操作,快速构建出满足特定需求的智能体,进一步降低了 Agentic AI 的开发门槛,促进了技术的广泛应用和创新。


注:本文分5段发表。

温馨提示:公众号推出“大势前瞻”、“长河探望”、“江山如画”、“商业世界的探索”、“安全&对抗经济”5个付费合集,这5个合集既独立成集,又浑然一体,是助您商业帝国或(投资)交易事业取得持续成功的良师益友;目前采用类似年费制;欢迎订阅。

w2.jpg

w3.jpg

w4.jpg

Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-10-26 18:56 , Processed in 0.133209 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表