400 128 6709

行业新闻

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

发布时间:2023-11-14点击次数:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

  • 项目地址:https://github.com/OpenBMB/ProAgent
  • 论文地址:https://github.com/OpenBMB/ProAgent/blob/main/paper/paper.pdf

在人类技术发展的历史长河中,自动化一直是主要的推动力,它帮助人类从复杂、危险、繁琐的劳动环境中解脱出来。从早期农业时代的水车灌溉,到工业时代的蒸汽机,人类一直在不断追求更先进的自动化技术,以解放自己从繁重的工作中

随着信息时代的到来,软件作为信息处理、存储和通信的基础成为了人类生产生活密不可分的一环,从而催成了机器人流程自动化(Robotic Process Automation, RPA)技术。其通过人工编制规则将多个软件协调成一个固化的工作流(Workflow),通过模拟人交互的方式来和软件交互实现高效执行。

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

在这张图中,我们将机器人流程自动化(RPA)与智能体流程自动化(APA)进行了比较

RPA(机器人流程自动化)利用软件机器人或“BOT”来模拟和执行重复性、规则性的任务,以解放人力资源,提高工作效率。RPA的应用范围非常广泛。许多企业(包括银行、保险公司、制造业、零售业等各个行业)通常使用RPA机器人来自动执行一些常规和繁琐的任务,例如数据录入、数据提取、数据处理。通过自动化任务,RPA可以大幅度减少错误率,并能够24*7不间断地执行任务,从而提高业务的可靠性和响应能力

根据市场研究,RPA市场正在迅速增长并取得巨大成功。Gartner预测,到2025年全球RPA市场收入将达到33亿美元,增长率为17.5%。这表明企业对RPA的需求和认可程度非常高

但是,RPA 仅能替代简单、机械的人力工作,一些复杂的流程仍旧依赖人工:

  1. 编写 RPA 工作流本身需要繁重的人类劳动,成本较高。
  2. 复杂任务非常灵活,通常涉及动态决策,难以固化为规则进行表示。

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

图 2 RPA 与 APA 的效率与智能对比

幸运的是,最近 AI 领域兴起的大模型智能体技术(Large Language Model based Agents, LLM-based Agents)也许给自动化技术创造了新的可能性。有没有可能将 Agent 技术的灵活性引入到 RPA 领域中,来进一步减少人的参与呢?

该团队的研究探讨了大模型智能体时代下新型自动化范式 “智能体流程自动化” Agentic Process Automation (APA)。和传统 RPA 相比,在 APA 范式中,Agent 可以根据人类的需求自主完成工作流构建,同时其可以识别人类需求中需要动态决策的部分,将自动编排进工作流中,并在工作流执行到该部分时主动接管工作流的执行完成相应复杂决策。

为了探索 APA 的可能性,该研究工作实现了一个自动化智能体 ProAgent,其可以接收人类指令,以生成代码的方式构建工作流,同在工作流中引入 DataAgent 和 ControlAgent 来在工作流中实现复杂数据处理与逻辑控制。ProAgent 的研究展现了 APA 在大模型智能体时代下的可行性,也揭示了 LLM 时代下,自动化技术的崭新可能性。

方法介绍

在RPA中,工作流程是由一系列工具调用组成的图形结构:节点代表原子化的工具调用(如Gmail、Twitter、Google Sheets),而边表示执行的逻辑顺序(连接、分支、循环)。一个工作流程通常包含一个或一类任务的所有先验知识,包括问题解决路径和异常处理逻辑等。因此,编写固定的工作流程往往非常稳定、周全且高效

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

图 3 智能体工作流描述语言示例

在 ProAgent 中,由于 LLM 本身在代码数据中进行预训练,学习到了较强代码能力,该研究便基于代码的智能体工作流描述语言 Agentic Workflow Description Language。该语言使用 JSON 实现对工作流中数据的组织与管理,选择 Python 语法实现对工作流的逻辑控制,将控制流中的跳转、循环等直接通过 Python 语法进行表征,同时将工作流中的工具调用封装为 Python Function。于是对于 ProAgent,工作流构建任务便转化为代码生成任务。当接收到人类指令时,ProAgent 便编写相应的 Agentic Workflow Description Language,从而实现了工作流自动化构建。

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

图 4 结合 DataAgent 和 ControlAgent 的智能体工作流描述语言示例

复杂的现实任务中通常会涉及动态决策,单纯的 Python 式的逻辑控制规则以及 JSON 式的数据组织形式在面对灵活的需求时便无能为力,此时便需要引入 agent。因此,该研究工作进一步定义出了两种 Agent 操作:

1. DataAgent:对于一个复杂的数据处理需求,工作流构建时会使用自然语言来描述处理的任务,然后在执行时会初始化一个 DataAgent,其会基于该自然语言描述自主处理并完成该数据处理任务。 

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

2. ControlAgent:对于难以用规则表示的逻辑控制规则,工作流构建时使用自然语言对控制逻辑进行描述,然后在运行时会初始化一个 ControlAgent,其会基于该自然语言描述自主选择工作流后续需要执行的分支。

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

ProAgent 使用 ReACT 模式逐步构建工作流,其共包含四个工作流构建步骤:

  1. Action_Define:决定在工作流中添加什么工具。
  2. Action Implement:将工具的输入 / 输出参数转化为 JSON 结构,同时将工具的调用封装为 Python 函数。
  3. Workflow Implement:定义一个 mainWorkflow 函数,用以组织整个 workflow 的逻辑控制与数据处理。
  4. Task Submit: 当 ProAgent 构建完 workflow 时以该操作标识构建过程结束。

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

示例中展示了 ProAgent 工作流构建过程的图 5

另外,为了优化 ProAgent 的效果,又引入了几个优化技巧:

  1. 1.Testing-on-Constructing:在构建过程中,ProAgent 会在一次修改工作流之后对工作流进行测试,以保证工作流的正确性。
  2. Function Calling:工作流构建的所有操作均封装为了 GPT-4 的 Function,从而提高对工作流构建过程的控制。
  3. Chain-of-Thought:ProAgent 在编写工作流代码时,需要对于每个 function 都要给出注释 comment 和一个编写 plan,从而提高 ProAgent 工作流构建的性能。

工作流的执行过程是基于 Python 解释器的。当给定一个工作流时,对应的 mainWorkflow 函数被用作执行的入口,从而开始整个执行过程。执行过程遵循 Python 代码的执行规则,即按照顺序逐行执行。一旦 mainWorkflow 函数返回,工作流的执行就成功完成了

可行性验证

为了验证 Agentic Process Automation 的可行性,该研究使用 OpenAI GPT-4 作为基础模型,并以一个开源的 RPA 平台 n8n 作为载体,实现了上述的 ProAgent。同时设计了一个需要兼顾灵活与效率的任务:这是一个典型的商业场景,需要从 Google Sheets 中提取各种业务线的营利数据,同时根据业务是否属于 2B 或是 2C,决定后续的行为。一旦确定业务线为 2C,就会向 Slack 频道发送一条消息。而对于 2B 的业务线,则会向相应的经理发送一封电子邮件,其中包括对业务线的评估和简要的盈利概况。

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

图 6 任务 Instruction 展示

需要重写的内容是:对于这个任务而言,首先它是一个重复性的任务,对于多条产品线,应该采取相同的处理流程。其次,要区分一个业务线是2C还是2B是很困难的,需要涉及到Agent的动态决策来确定后续的工作流程。最后,根据编写业务线的评估邮件需要一定的智能,因此需要Agent的介入

在 ProAgent 生成中,对于该任务,编写出了一个包含四个原子操作,一个 DataAgent 和一个 ControlAgent 的工作流。总体过程大致如下图所示:

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布图 7 ProAgent 工作流构建过程展示

可以看到,ProAgent 通过自主编写代码的方式,自动完成了工作流的构建过程,其中无需涉及人工介入。在需要判断业务线是 2B 还是 2C 时,ProAgent 引入了 ControlAgent 来做判断,ControlAgent 的 Prompt 被设置为 “Decide Whether the business line is toC or toB”。当业务线为 2B 时,ProAgent 还引入了一个 DataAgent,其任务设置为 “Write a email of the business line of profit, together with your suggestion”,从而利用 agent 的智能来根据不同业务线的实际情况来撰写邮件。

在工作流被编写、固化下来以后,工作流就会根据不同的数据自动分支到不同的逻辑进行高效地数据处理了。

ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布

图 8 ProAgent 工作流执行过程展示

当处理2C业务线数据时,ControlAgent可以根据业务线描述来判断当前业务线的类型,并选择使用Slack工具进行沟通。而在处理2B业务线数据时,DataAgent可以撰写邮件并发送到相应经理的邮箱中

总结

这项研究提出了一种新的自动化范式——Agentic Process Automation,适用于大模型时代。与传统的Robotic Process Automation技术相比,Agentic Process Automation能够自动化工作流的构建,并实现工作流执行时动态决策的自动化。该研究还进一步开发了ProAgent,并通过实验证明了大模型智能体在自动化中的可行性和潜力。相信未来,大模型智能体技术将帮助人类实现更高层次的自动化,从繁重的劳动中解放出来

团队相关研究

目前研究团队已在大模型智能体方向有诸多研究,包括:

  • XAgent:超强大模型智能体应用框架,可自行拆解复杂任务,并高效执行。
  • 项目地址:https://github.com/OpenBMB/XAgent
  • ChatDev:多智能体协作开发框架,让多个不同角色的智能体进行协作,自动化开发软件应用。
  • 项目地址:https://github.com/OpenBMB/ChatDev
  • AgentVerse:大模型驱动的智能体通用平台,招募各种各样的 agent 专家,共同帮助用户解决复杂任务。
  • 项目地址:https://github.com/OpenBMB/AgentVerse

以上就是ProAgent:OpenAI引领下的智能代理解放人力,清华等高校发布的详细内容,更多请关注其它相关文章!


# 实现了  # 南丰网站关键词推广  # 推广紧固件的免费网站  # 庆阳暖棚建设招标网站  # b2b优化网站教学  # 线上网络seo推广  # 小餐车推广营销计划书  # SEO站群方案模板  # 武汉seo外包醯行者seo02  # seo学习难嘛  # 学网站建设的就业行业  # 可以根据  # 数据  # 多个  # 出了  # 本田  # 工作流程  # 自然语言  # 数据处理  # 清华  # 工作流  # descript  # openbmb  # 训练 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 机器人加速!稀土永磁也被带火,持续性如何?  【原创】奥比中光:与英伟达合作开发的3D开发套件正式发布 连接英伟达AI应用生态  全场景智能车:智能无处不在|芯驰亮相世界人工智能大会  AI进军债券交易,BondGPT来了!  人工智能赋能无人驾驶:商业化进程再提速  日新月异,脑机接口技术都有哪些新应用?  零AI含量!纯随机数学无限生成逼真3D世界火了,普林斯顿华人一作  一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了  技术如何使人变得懒惰?  AI取代人工先拿教育行业开刀?美版“作业帮”启动裁员  DragGAN开源三天Star量23k,这又来一个DragDiffusion  引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot  彭博社:苹果Vision Pro曾测试VR手柄追踪方案  Meta发布音频AI模型,仅需2秒片段模拟真人语音  酒店业将如何受益于人工智能的改变?  先进技术在防止全球数据丢失方面的作用  抢占新赛道 加快机器人产业集聚发展  小红书陷入麻烦!被指控未经许可使用用户图片进行AI训练  从谷歌到亚马逊,科技巨头们的AI痴迷  金山办公宣布与英伟达团队合作,加速WPS AI服务  看懂AI,找到增长新势能 | 笔记侠AI峰会等你来  破解零碳产业园建设规范和成果评价难题  Meta发布"类人"AI图像创建模型,能解决多出手指等Bug  马斯克发推讽刺人工智能,机器学习本质是统计?  AI与5G的强强联合:唤醒数字时代的无尽潜能  谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务  读创正式上线“读创AI聊”功能  视觉中国推出付费AI绘图功能:无版权可用  如布AI口袋学习机S12 将亮相综艺节目《好样的!国货》  大模型的“黄金搭档”来了!腾讯云正式发布AI原生向量数据库,提供10亿级向量检索能力  OpenAI 向所有付费 API 用户开放 GPT-4  生成式人工智能来了,如何保护未成年人? | 社会科学报  提升工作效率的智能工具:Zapier 让工作变得更简单!  OpenAI限制网络爬虫访问以保护数据免被用于AI模型训练  AI证件照生成器:实际测试中AI软件展现了绝无仅有的强大效能  【趋势周报】全球元宇宙产业发展趋势:ChatGPT的出现,将元宇宙实现至少提前了10年  中国最强AI研究院的大模型为何迟到了  生活垃圾智能分类机器人社区展“才能”,征求居民意见  管提需求,大模型解决问题:图表处理神器SheetCopilot上线  如何成功实施人工智能?  全新“AI助手”!讯飞星火助手中心人机协作共创新生态  人手一部「*」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友  构建AI绘画网站的方法:使用API接口和调用步骤  丰田汽车研究院推出生成式人工智能汽车设计工具  联想戴炜:以全栈AI加速CT与IT融合,共建高质量算力网络  云深处与昇腾CANN携手合作:开设ROS四足机器狗开发训练营  联想首发AI PC于今年秋季,英特尔CEO确认AI PC时代来临  腾讯AI首次模拟拼接三星堆文物,工作取得阶段性的成果  小岛秀夫不反对使用AI 但认为人类应该凌驾于AI  ChatGPT会成为你家新的语音助手吗? 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司