关闭

深度解读大模型最火的智能体(Agent)

发表于:2024-7-09 09:16

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:朱杰    来源:大数据和云计算技术

  有同学觉得 copilot 和 Agent 没啥区别,核心原因是认为,Copilot是传统软件使用AI 增强,这时被包裹成为copilot,另种形式 Agent 是AI系统(目前常见各种对话)包裹传统系统API,这时称为Agent。这两者没有明显区别,同样的实现逻辑。
  其实这个是有误区的。
  核心概念区别
  Agent 和 Copilot 最核心区别在于是否能自主完成任务,并不是是否调用其他能力。类似自动驾驶里面的 L2,L3的区别。agent 也可以包在传统软件里面,是否包,还是独立的,不是这个核心区别。
  AI Agent 是一种智能实体,它能够感知环境、进行决策和执行动作。AI Agent 通常具有自主性,能够根据给定的目标或任务,独立地进行规划、执行和反思。它们可以分解复杂任务,自我批评和自我反思,从错误中学习,并改善结果。AI Agent 可以被视为具有一定程度自主性和复杂推理能力的系统,它们可以在没有人类直接干预的情况下完成任务。
  AI Copilot,另一方面,通常是指一个通过AI技术赋能的智能助手,它协助人类完成各种任务。AI Copilot 可能在特定领域(如编程、写作、驾驶等)提供帮助,通过与人类的交互来提高效率和创造力。AI Copilot 可能更多地依赖于人类的输入和指导,而不是完全自主地完成任务。
  简而言之,AI Agent 更强调自主性和独立完成任务的能力,而 AI Copilot 更侧重于作为人类的助手,协助完成特定任务。AI Agent 可能在复杂性和自主性方面更为先进,而 AI Copilot 则更注重与人类的协作和辅助。
  讲完概念,今天继续深度下 Agent 的架构,当前问题,业界典型范例给大家参考。
  典型Agent 架构
  下图是一个典型的 Agent 架构。
  一个 Agent 里面核心几大块:
  1、大模型:负责思考,给出执行,调用的参数。
  2、能力库:外挂的各种能力,比如约会议,查文档都是调用另外的系统完成。
  3、历史:主要是记录上下文
  4、用户澄清:当前 Agent 比较难脱离人的检查确认,所以一般有这一步用户的确认和修改过程。
  5、最终展示:有多种展示形式,卡片式,或者给自然语言展示结果。
  接下来看下 Agent 实际的范例和当前存在的问题。
  业界 Agent 范例
  Copilot 有很多成功的范例,最出名的有 GitHub copilot,Microsoft office 365 copilot。大模型已经成功在编程,文案,创意等方向有不错的实践。
  当前智能体 Agent 还处在比较早期的阶段,已经有一些比较明显的成果,当前有些典型的尝试:
  ·角色扮演类:比如英语口语老师,情感分析大师。
  · 创作类:各种营销文案如新媒体文章,小红书文案编写等。
  · 办公类:ppt 自动生成,研究报告生成等。
  不过总的来说特别实用的 agent 其实还没有孵化出来。
  从另外一个角度思考,大模型是一个全新的领域,,从成熟度角度,可以认为:
  GPU > LLM > Agent builder > Agent&Application
  越是底层越成熟,也只有底层成熟了才能孵化上层的业务。因此如果要有一个比较不错的 Agent,可能需要成熟的 Agent builder。可能有又有小伙伴想知道都有哪些 Agent builder,后面找时间详解一下业界都有哪些 Agent builder各自特点是什么。
  下图是 AI Stack 典型技术栈,给忘记的同学回顾:
  当前Agent 存在的问题
  人工智能大牛吴恩达是 Agent 的拥趸,先简单回顾吴恩Agent 四范式:
  · Reflection(反思):类似于AI的自我纠错和迭代。例如,AI系统会检查自己编写的代码,并提出修改建议。
  · Tool Use(工具使用):大语言模型调用插件,扩展了其能力。例如,使用Copilot进行联网搜索或调用代码插件解决数理逻辑问题。
  · Planning(规划):AI根据用户输入的任务,拆解流程、选择工具、调用、执行并输出结果。例如,根据一张图片中的姿态生成一张新图片,并进行描述。
  · Multi-agent(多智能体协作):多个Agent协作完成任务,每个Agent可能扮演不同的角色,如CEO、产品经理或程序员。这种模式模拟了现实生活中的工作场景,能够处理复杂系统
  Agent大家未来肯定看好,但是 agent 当前还是存在比较多的问题,仍能需要工业界持续去改进。
  · 性能问题
  传统互联网产品性能都是毫秒级,调用大模型需要等待的时间较长,一些场景下用户不愿意等待的。
  · 效果问题
  纯大模型很难上线,还要套用规则或者其他一些手段补充和弥补
  · 成本问题
  业务真实场景下,调用大模型成本还是很高。
  · multi-agent 还没有起来
  没有把多个 bot组织起来,快速构建大量的智能体。吴恩达认为多agent 效果会很好,但是怎么组合调用,还没有看到很好的成果经验。
  总的来说,前途是光明的,道路还是曲折的。
  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2024软件测试行业从业人员调查问卷》,您的见解,行业的声音!

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号