AI豆包、Open-AutoGLM颠覆了手机端RPA.开启新纪元,“手撸”RPA该何去何从?
作者:微信文章点点关注获取最新行业信息不迷路~~ “AI豆包、开源Open-AutoGLM”等模型,正在引发RPA(机器人流程自动化)的一场根本性变革。我们来系统地分析这一趋势对于传统人工RPA的影响到底有多大?是否会被完全替代?
核心颠覆:从“基于规则”到“基于理解”
传统“手撸”RPA的本质是基于规则的自动化。开发者需要像教一个严格的士兵一样:
1.精确录制或编写操作步骤(点击这里,输入那里)。
2.定义严格的判断逻辑(如果出现A则点X,如果出现B则点Y)。
3.处理大量异常和界面变更(任何细微的UI变化都可能导致流程崩溃)。
而新一代AI驱动的RPA(我们可称之为“智能流程自动化”或IPA)的核心是基于理解的自动化。大语言模型(LLM)如豆包、GLM带来的能力是:
1.意图理解:能理解用户用自然语言描述的任务目标(如“帮我将最近一周的微信账单整理到Excel里”),而无需一步步指令。
2.视觉与内容理解:通过屏幕识别(OCR,UI元素理解)直接“看懂”手机界面上的文字、图标、布局,并像人一样做出决策该点哪里。
3.动态适应与推理:能处理非标准化的流程,应对简单的界面变化,甚至能进行多步骤的逻辑推理(例如,如果订单提交失败,尝试换一种支付方式再提交)。
Open-AutoGLM这类项目的开源,更是降低了技术门槛,让社区能快速构建和迭代专属的智能体,加速了AI RPA在复杂场景下的应用。
对“手撸”RPA发展的评价:不是消亡,而是进化与分工
“手撸”RPA不会突然消失,但其角色、价值和适用场景将发生剧烈转变。
1. “手撸”RPA的何去何从?
退守“核心”与“底层”:
高性能、超稳定核心链路:对于银行交易、财务结算等绝对不允许出错的标准化核心流程,“手撸”的、经过严密测试的规则化脚本在可预见的未来仍更可靠。
成为AI RPA的“可靠执行手臂”:AI负责理解和决策,但具体的点击、输入、数据搬运等底层操作,可以调用“手撸”好的、高度优化的原子化组件来执行,确保执行环节的精准。
转向“架构师”与“训练师”:
开发者的角色转变:从“流程编写者”变为 “AI智能体架构师”或“领域专家训练师” 。工作重点变为:设计合理的任务分解框架、为AI准备高质量的领域数据(如屏幕截图、操作日志)、定义验证和回退机制、微调领域模型。
聚焦复杂集成与异常处理:处理那些需要连接老旧数据库、特殊API或处理极端异常情况的复杂场景,为AI系统提供支持和兜底。
2. 人工RPA发展的新纪元:AI-Native RPA
未来的RPA开发将是 “AI原生” 的:
开发范式:
从“编程”转向 “描述、对话与调试” 。用户或开发者用自然语言描述任务,AI生成执行计划并尝试执行,人类在关键节点进行确认或纠正。这是一个协同进化的过程。
核心价值迁移:
从“自动化能力”到“智能与泛化能力”:价值不在于自动化了一个固定流程,而在于它能理解并自动化一类相似的任务。
从“提升效率”到“赋能人人”:最大的颠覆在于平民化。
挑战与焦点:
可靠性与信任:如何确保AI的每次操作都准确无误?需要建立完善的验证、审计和人工介入机制。
安全与隐私:AI助手需要极高的系统权限,如何保证用户数据不被滥用或泄露是生死攸关的问题。
场景深化:
从简单的信息收集、表单填写,走向更复杂的多应用协调、业务流程决策支持(例如,根据多个App的信息对比,做出最优采购决策)。
结论
颠覆已至,趋势不可逆:以豆包、Open-AutoGLM为代表的AI智能体,确实开启了手机端RPA的“新纪元”。它们通过自然语言理解和视觉识别,解决了传统RPA在移动端部署难、适配成本高的核心痛点。
“手撸”RPA不会死,但必须蜕变:它将从舞台中央的“主演”退位为“关键配角”和“基础设施提供者”,在需要绝对可靠性和性能的领域继续发挥作用,并成为AI RPA的坚实底座。
未来的赢家是“人机协同”:最成功的模式不会是纯粹的AI或纯粹的规则,而是人类(定义目标、提供领域知识、处理例外) + AI(理解意图、生成方案、灵活执行) + 传统自动化(稳定执行原子操作) 的三位一体。
对从业者RPA开发者必须紧急向AI技能转型,学习提示工程、基础模型微调、智能体架构设计。企业和用户则应积极拥抱和试点AI驱动的自动化,从简单的个人效率场景开始,逐步积累信任,向核心业务场景渗透。
简而言之,这不是“手撸”RPA的终结,而是RPA从“自动化工具”升级为“智能数字员工”时代的开始。竞争的维度,从比谁的脚本写得好,变成了比谁的AI更懂业务、更可靠、更易于协作。人类从传统人畜的农耕开始到半机械化再到全机械化的演变与RPA的发展相似,人类的文明会随时间进步,技术亦是如此,学习是不被边缘化最快的捷径。
页:
[1]