AI 代理应该是人工智能领域的下一个大事件,但对于它们的确切定义并没有一个统一的看法。到目前为止,人们无法就什么构成 AI 代理达成一致意见。
在其最简单的形式下,AI代理最好被描述为AI驱动的软件,为您执行一系列工作,这些工作过去可能由人类客服代理、人力资源人员或IT帮助台员工完成,尽管最终可能涉及任何任务。您要求它执行任务,它会为您执行,有时会跨越多个系统,远远超出简单回答问题的范畴。
似乎很简单,对吧?然而,缺乏明确性使事情变得复杂。即使在科技巨头之间,也没有共识。谷歌将它们视为基于任务的助手,根据工作不同而不同:为开发人员提供编码帮助;帮助营销人员创建配色方案;通过查询日志数据协助IT专业人员追踪问题。
对于Asana来说,代理人可能会扮演额外的员工,像一个出色的同事一样处理分配的任务。Sierra, 一家由前Salesforce联合首席执行官Bret Taylor和Google资深员工Clay Bavor创立的初创公司,将代理人视为客户体验工具,帮助人们完成远远超越往昔聊天机器人的操作,以解决更复杂的问题集。
这种缺乏统一定义确实会导致对这些事物到底是做什么产生困惑,但无论如何定义,这些代理都是为了以尽可能少的人为干预来帮助完成任务而设计的。
Rudina Seseri,Glasswing Ventures的创始人兼管理合伙人表示,现在还处于早期阶段,这可能解释了缺乏一致性的原因。'AI agent'没有一个统一的定义。然而,最常见的观点是,代理是一种智能软件系统,旨在感知其环境,对其进行推理,做出决策,并采取行动以自主实现特定目标,Seseri告诉TechCrunch。
她说他们使用多种人工智能技术来实现这一目标。"这些系统结合了各种人工智能/机器学习技术,如自然语言处理、机器学习和计算机视觉,在动态领域中自主运行或与其他代理和人类用户一起运行。"
Aaron Levie,Box的联合创始人兼首席执行官表示,随着时间推移,随着人工智能变得更加强大,AI代理将能够代表人类做更多事情,目前已经存在推动这种演变的动态。
“AI代理有多个组成部分,构成了一个自我强化的飞轮,将大幅提升AI代理在短期和长期内所能实现的成就:GPU价格/性能、模型效率、模型质量和智能、AI框架和基础设施的改进,” Levie 最近在 LinkedIn 上写道。在此处
这是对技术的乐观看法,假设增长将在所有这些领域发生,但这并非必然。麻省理工学院机器人学先驱罗德尼·布鲁克斯在最近的TechCrunch采访中指出,人工智能必须处理比大多数技术更棘手的问题,并且不一定会像摩尔定律下的芯片那样迅速增长。
“当人类看到人工智能系统执行任务时,他们立即将其推广到类似的事物,并对人工智能系统的能力进行估计;不仅仅是在这个任务上的表现,还包括周围的能力,”布鲁克斯在采访中说道。“通常他们非常乐观,这是因为他们使用了一个人在任务上表现的模型。”
问题在于跨系统操作很困难,而且一些传统系统缺乏基本的API访问权限,这使情况变得更加复杂。尽管我们正在看到Levie所提到的稳步改进,但让软件访问多个系统并解决可能遇到的问题可能比许多人想象的更具挑战性。
如果是这种情况,每个人可能都高估了AI代理应该能够做到的事情。HFS Research的研究负责人David Cushman认为,当前的机器人更像Asana所做的那样:助手,帮助人类完成某些任务,以实现某种用户定义的战略目标。挑战在于帮助机器以真正自动化的方式处理突发情况,而我们显然还远远没有达到这一点。
“我认为这是下一步,”他说。“这是人工智能独立有效地运作的地方。所以这是人类设定指导方针、保护栏,并应用多种技术将人类排除在外的地方 —— 一切都是关于让人类与GenAI保持联系,”他说。所以关键在于,他说,让人工智能代理接管并应用真正的自动化。
Jon Turow,Madrona Ventures的合伙人表示,这将需要建立一个AI代理基础设施,一个专门设计用于创建代理的技术堆栈(无论您如何定义它们)。在最近的一篇博客文章中,Turow 概述了目前在野外工作的AI代理的示例,以及它们如何被构建。
在图罗看来,人工智能代理的不断增多——他也承认,定义仍有些模糊——需要像其他技术一样的技术堆栈。他在文章中写道:“所有这些意味着我们的行业需要努力构建支持人工智能代理和依赖它们的应用程序的基础设施。”
随着时间的推移,推理能力将逐渐提高,前沿模型将开始引导更多的工作流程,开发人员将希望专注于产品和数据——这些是让他们与众不同的东西。他们希望基础平台在规模、性能和可靠性方面能够“只管运行”
这里需要记住的另一件事是,要使代理工作,可能需要多个模型,而不是单个LLM,如果你把这些代理看作是不同任务的集合,这是有道理的。“我认为目前任何单个大型语言模型,至少是公开可用的,单一的大型语言模型,都无法处理代理任务。我认为它们还不能进行多步推理,这真的让我对代理未来感到兴奋。我认为我们正在接近,但还没有到达那一步,” Macquarie美国股权研究部门AI和软件研究负责人弗雷德·哈夫迈尔(Fred Havemeyer)说。
我认为最有效的代理可能是多个不同模型的多个集合,具有一个路由层,将请求或提示发送给最有效的代理和模型。我认为这将类似于一个有趣的自动监督者,扮演着一种委派角色。
对于哈夫迈尔来说,该行业最终的目标是让代理商能够独立运作。他告诉TechCrunch:“当我思考代理商的未来时,我希望看到并期待看到真正自主的代理商,能够独立实现抽象目标,并完全独立地推理出所有中间的个别步骤。”
但事实是,就这些代理人而言,我们仍处于过渡期,我们不知道我们何时会达到哈夫迈尔描述的最终状态。尽管迄今为止我们所看到的显然是朝着正确方向迈出的一大步,但我们仍需要一些进展和突破,让人工智能代理人能够按照今天的设想运作。重要的是要明白,我们还没有达到那一步。