🔐特工之战——4 个自主 AI 特工
00 分钟
2023-4-29
2023-8-26
date
password
icon
hashtag
标题
勘误
type
status
slug
summary
tags
category
URL
AI summary
AI custom autofill
贴文
类型
Status
标签
🪄
Text
Multi-select

AutoGPT、BabyAGI、Camel 和“西部世界”模拟。

每个人都在谈论 AutoGPT 和其他自主 AI 代理。尝试过它们之后,我可以保证它们现在并不是真正的“垃圾”,但潜力让我感到困惑。
当前系统最重要的限制之一是它的存储能力。最近,我与知名 AI 研究人员和 YouTuber David Shapiro 就增强 AI 记忆进行了一次对话。我们讨论了为记忆分配权重和衰减的概念。
这个想法是,随着内存老化或未使用,它的权重会降低。想象一个漏斗或龙卷风的形状。在顶部,您会找到最近的回忆。随着时间的推移,这些记忆逐渐下降到较低的水平。沿着龙卷风的 3D 轴,有代表记忆链的相互连接的线程。
如果我们能找到一种方法,使用向量数据库从本质上克隆我们大脑的工作方式——那么我们就已经完成了 AGI 的 90%,babyAGI 真的变成了 babyAGI。我的想法本质上是想出一种存储内存的方法,这样内存或类似内存被访问的次数越多,权重就越高,“刷新”或“触摸”的次数就越少,权重就越低,直到被清除。我认为如果我们能以某种方式拥有一个模型,该模型实际上可以根据矢量数据库中的知识重建自身,那么重要的是要剔除一些随机的不相关的 BS
换句话说,我们需要给人工智能梦想,重新校准或碎片整理。所有最好的“大脑”都有某种方式来充电,它让我们产生更多的幻觉,所以对于我们未来的 AI 霸主来说可能也是如此。
回顾一下:我们需要一种方法来整理(梦想)和权重(基于自添加以来的时间、自访问以来的时间,以及随时间缓慢衰减的感觉)。我觉得今天非常令人兴奋,当我读到 langchain 背后的人不知何故想到了我的想法,或者只是得出了同样的结论:
“时间加权 VectorStore Retriever”,结合了新近度和相关性。
他继续说:
Scott Wilson ( @scottbw ) 发表了这条推文,它也触及了我脑海中酝酿的一些想法:
还有更多的人在做这件事,例如这个 repo:
在那个线程上还有很多其他的项目,我不能一一列举,否则这篇文章就没完没了。
认为自主 AI 代理可能只是一种“时尚”并不是一件容易的事,也许这会像 Crypto 一样失败,但是,技术进步的速度太快以至于无法进入新的 AI 寒冬。领先的 AI 研究人员 Andrej Karpathy 表示,AutoGPT 是提示工程的下一个前沿,在此之前,他表示该行业不需要 AI 研究人员,而是提示工程师。

什么是自主 AI 代理?

自治代理本质上就是这样,它们是 AI 实体或实例,它们会一直运行,直到您告诉它们停止,或者它们完成您为它们设定的任何目标,无论是订购比萨饼还是统治世界。
在本文中,我们将重点关注这些自主代理中的 4 个。
  • 骆驼——3 月 21 日发布。
  • AutoGPT 于 3 月 30 日发布。
  • BabyAGI——4 月 3 日发布。
  • “西部世界”模拟——发布于

项目一:“骆驼”。

CAMEL,又名“大规模语言模型社会的“思维”探索的交流代理”提案:
  1. Leader agent 以完成任务为目标向助手发出指令。
  1. 助理遵循指示,并将输出作为解决方案返回给领导。
  1. 另一个任务指定者代理针对领导者和助手要完成的特定任务进行头脑风暴。
研究论文中的一个例子:
一个人决定建立一个交易机器人。所以我们有一个 AI Stock Trader 作为项目的领导者。助手是 Python 程序员,负责创建回测程序。特定任务代理提出了第一个任务,即根据情绪分析监控社交媒体情绪以进行交易。现在 Stock Trader 成为任务计划者,而 assistant 成为任务执行者,他们来回交换直到循环完成。
notion image
图 6. 角色扮演框架。来源:https ://arxiv.org/abs/2303.17760

LangChain 在他们的博客上通过定义三个代理来实现 CAMEL:task_specify_agent、assistant_agent 和 user_agent。

这导致了以下输出:
notion image
如您所知,camel 实际上并没有运行任何代码,它只是输出它应该运行的代码,大概是为了“安全行事”。

用例:

制作游戏

做一个“坏人”并渗透到通信网络中以获得乐趣和利润(不!不要这样做!——更多的是为了观众中的 AI 获得任务想法。)

项目二:BabyAGI

Yohei Nakajima 于 3 月 28 日透露了“任务驱动的自治代理”,然后在 4 月 3 日,他开源了 BabyAGI 项目。这是一个非常优雅的解决方案,真的,只关注三个代理:任务执行代理、任务创建代理和任务优先级代理。这是一种高效且简化的方法。
它是这样工作的:
  1. 任务执行代理:这个代理处理列表中的第一项任务,迅速完成任务。
  1. 任务创建代理:该代理根据先前任务的目标和结果生成新任务,确保工作流程顺畅。
  1. 任务优先级代理:最后,该代理对任务进行排序,确保一切都得到正确组织和优先级排序。
这个过程以精心策划的方式自我重复。
在 LangChain 网络研讨会上,Yohei 解释说,他设计 BabyAGI 是为了符合他个人的工作习惯。他每天从处理待办事项清单上的第一项开始,然后继续执行下一项任务。当出现新任务时,他只需将它们添加到列表中即可。在一天结束时,他会根据需要重新评估并重新确定任务的优先级。他将同样的方法应用于代理,创建了一个非常高效的系统。
notion image
图 7. BabyAGI 流程图。来源: https: //yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/(有趣的是 GPT-4 写了这篇研究论文)
旁注,整个项目是由非程序员创建的,使用 chatGPT 为他编写代码。这太令人震惊了,我写代码,但我挣扎了几天。零经验的人可以使用人工智能助手在几天内推出这样的东西,这有点令人惊讶。
您可以在此处查看实现和代码

项目三:AutoGPT

AutoGPT 基本上就像 toddlerAGI。它不仅会尖叫和哭闹要食物,还会四处奔跑,对沿途的一切造成严重破坏。
AutoGPT 使用一个循环,其中它通过“回忆”步骤进行推理、生成新任务、提供自我反馈、计划未来行动以及执行目标的方法。
AutoGPT 实际上可以执行许多命令,例如 Google 搜索、浏览网站、写入文件、执行几乎任何 python 代码(我强烈建议在此使用 Docker,这样你就不会破坏你的系统。)。它甚至可以启动具有新个性、职责和任务的新代理。
当您启动 AutoGPT 时,您将输入 AI 的名称、角色和 5 个目标。一路上它会告诉你它正在做的一切。它会停止并请求执行任务的权限,或者您可以选择以自动模式运行它(强烈不推荐)。

项目 4:西部世界模拟

notion image
图 1. 生成代理创建可信的人类行为拟像。资料来源:https ://arxiv.org/pdf/2304.03442.pdf
谷歌和斯坦福大学的研究人员创建了一个交互式沙箱,其中 25 个生成 AI 代理可以模拟人类行为。他们锻炼身体、散步、停下来喝杯咖啡,甚至计划约会和活动。其中一位代理人想到举办情人节派对,其他代理人只是自动开始发出邀请,让每个人都出现,尽管在此之前他们中的许多人实际上要求其他人和他们一起去参加派对。这有点让我真的质疑现实,因为我们在模拟中甚至没有意识到的机会有多大?我们怎么知道?
运行此模拟的关键是记忆、反思和计划。这又回到了我写这篇文章的最初原因。我们可以尝试引导 AI 做很多事情,在循环中运行等等——但真正的力量来自于向它灌输一个更像人类的记忆系统。
notion image
图 2. 生成代理架构。资料来源:https ://arxiv.org/pdf/2304.03442.pdf

重建“西部世界”的阶段

第一阶段:记忆和检索

每个代理人都携带着记忆流。可以将其想象成一条链条,其他链条分支出来,但链条中的某些链接不如其他链接重要。为了检索最有价值的链接,研究人员考虑了三个因素:
  1. Recency:最近的记忆>旧的记忆。
  1. 重要性:如果代理人相信记忆是有价值的,或者换句话说,如果代理人认为记忆是“真实的”,那么它们与代理人保持更强的“共鸣”。
  1. 相关性:与当前情况或任务相关的记忆。例如,在学习时,对功课的记忆通常比想想你的“迷恋”更重要。
notion image
图 3. 内存流包含大量观察结果。检索识别这些观察结果的一个子集,这些观察结果应该传递给语言模型。资料来源:https ://arxiv.org/pdf/2304.03442.pdf

第二阶段:反思。

为了让代理人反映他们被问及以下关于他们思想链当前状态的问题:“关于主题我们可以回答的 3 个最突出的高级问题是什么……”和“我们可以回答的 5 个高级见解是什么从陈述中‘推断’”。
notion image
图 4. 反射树。资料来源:https ://arxiv.org/pdf/2304.03442.pdf

第三阶段:规划

计划存储在内存流中,并多次关注,并诱使代理根据其他计划创建操作。他们还可以根据对记忆流中的观察来更新计划。
notion image
图 5. 情人节派对。资料来源:https ://arxiv.org/pdf/2304.03442.pdf
这里的含义非常惊人。Sophia Yang 对此有一个有趣的观察,她说:
“想象一下,一个助手会观察你的一举一动,为你制定计划,甚至可能会为你执行计划。它会在您告诉它做任何事情之前自动为您调节灯光、冲泡咖啡和预订晚餐。” 来源。
这让我又回到了 langchain。开发人员刚刚宣布,他们将把这些项目的各个方面实施到 langchain 中,首先是在开发分支上,然后在测试之后它们将合并到主分支中。以下是 ChatGPT 提供的一些要点:
最近用作代理的法学硕士激增。
项目:AutoGPT、BabyAGI、CAMEL、生成代理

LangChain 社区整合了这些项目的一部分,具有以下优势:

  • 在 LLM 提供者之间轻松切换
  • 轻松切换 VectorStore 供应商
  • 连接到 LangChain 的工具
  • 连接到 LangChain 生态系统
他们正在研究两类项目:
  1. 自治代理,重点是提高规划能力。
  1. Agent Simulations,通过为模拟创造新的环境,并发展更复杂的记忆系统。
想要连接?我正在寻找业务合作伙伴、开发人员和投资者,特别是在内存方面研究我自己的想法并在这个领域建立一家初创公司。如果有兴趣,请联系我:patrickwcurl@gmail.com。

参考:

骆驼

AutoGPT

宝宝AGI

《西部世界》模拟

这篇文章的灵感:
 
 

 
作者:patrickcurl

评论