百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 文章教程 > 正文

AI Agent 技术基石-ReAct

xsobi 2024-12-10 21:36 1 浏览

本文将探讨 AI Agent ,Lilian Weng在其博文《LLM Powered Autonomous Agents》 中,对基于LLM的AI Agent 做了系统综述.

在这篇博客中,Agents 被定义为LLM、记忆(Memory)、任务规划(Planning Skills)以及工具使用(Tool Use) 的集合,其中 LLM 是组成Agent 大脑,Memory、Planning Skills 以及 Tool Use 等则是 Agents 系统实现的三个关键组件.

Memory: 包括长期记忆和短期记忆,短期记忆即输入到LLM 中的Prompt提示词,长期记忆即Agent 外挂的知识库.

Planning Skill + Tool Use (Action) 在Agent 中,则是ReAct 技术需要进行阐述的两个部分,ReAct 技术是所有Agent 的基础,其来源于Google 大脑《ReAct:Synergizing Reasoning And Actiong In Language Models》 这篇论文;在 ReAct 工作之前,大家往往将大模型的推理能力和行为决策能力分开进行研究。而 ReAct 首次在语言模型中将推理和行为决策紧密结合起来,使得语言模型的推理能力能够根据知识进行计划安排,行为决策能够与外界工具进行交互。

ReAct = 推理 + 执行动作得到观测结果,其数学表达式如下:

ReAct灵感来自于作者对人类行为的一个洞察:在人类从事一项需要多个步骤的任务时,每一步之间往往会有一个推理过程。作者提出让 LLM 把内心独白「说」出来,然后再根据独白做相应的动作,模仿人类的推理过程,以提高 LLM 答案的准确性.

像CoT链式推理一样,ReAct是一种提示工程方法,使用少量样本学习教会模型如何解决问题。CoT旨在模仿人类思考问题的方式,ReAct也包括这种推理元素,但它更进一步,允许代理文本动作,让它也可以与环境互动,缓解了CoT 在实际问题解决上的幻觉。

最后做一下总结,ReAct的本质:人类使用言语推理(说话或思考)来帮助我们制定策略和记忆事情,但我们也可以采取行动来获取更多信息和实现我们的目标。

在接下来的文章中,机器学习搬运工将介绍一下Planning 中Reflection 技术,然后结合LangChain 框架进行代码实战。

相关推荐

Android Studio 导入项目出现缺失解决

很多朋友安装好Androidstudio后准备试一把,但是导入项目的时候出现错误Cannotfindfile"...../project_name/settings.jar"这个错误是因为导入...

首个安卓12开发者预览版发布:隐私保护升级、更新UI、优化性能

来源:环球网2月20日消息,据engadget报道,来到二月,惯例也是谷歌发布安卓12开发者预览版的时候,以便于让开发者提前查看下一版安卓系统的新属性。谷歌工程副总裁戴夫·波尔克(DaveBurke...

推荐几个非常有用的开发工具之Android Studio插件

我们都知道Eclipse开发Android将在今年年底google不再继续提供相应的开发支持,转而开始强烈发展AndroidStudio,现在我就分享几款能帮助团队提升工作效率的几个Android...

Android Studio下的应用性能优化总结-内存优化

上一篇文章总结的布局优化的问题,如果对布局优化不是很熟悉的,可以看一下AndroidStudido下的应用性能优化总结–布局优化,这周一直筹划总结一下内存优化的问题,因为现在对于应用优化的文章很...

安卓开发之环境搭建「图文教程」 安卓应用开发环境搭建

安卓(Android)是一种基于Linux的自由及开放源代码的操作系统。主要使用于移动设备,如智能手机和平板电脑,由Google公司和开放手机联盟领导及开发。接下来开始第一个安卓应用吧!需要用到的软...

Android APP性能测试上篇--启动时长、内存

如图所示,列出了目前app主要的一些性能指标,以及对应使用的测试工具。普遍的app性能测试,主要是以下几类:启动时长、内存、cpu、FPS(app使用的流畅度)、GPU过度渲染、耗电、耗流、cras...

AndroidStudio下的依赖管理 安卓依赖管理

在开发中用第三方库是很常见的事,如何在AndroidStudio下管理这些依赖呢?这就是这篇文章的目的。目录Maven/Ivy仓库依赖Module依赖aar文件依赖jar文件依赖例子完整代码一、Mav...

基于Android的师生学习交流平台:Android课程设计

基于Android的师生学习交流平台(Androidstudio毕业设计,Android课程设计)一、项目介绍系统分为学习资料,作业,师生交流,个人资料四大模块(1)学生端:新用户需要填写真实姓名,...

Android Studio 贴士 - 综述#3 android studios

(点击上方公号,可快速关注)英文原文:http://www.developerphil.com/android-studio-tips-of-the-day-roundup-3注:文中链接皆为国外链接...

Android 11 Developer Preview首次更新发布:修复诸多问题

此前在2月19日,谷歌放出了Android11DeveloperPreview(安卓11开发者预览版),并表示Beta版本将于5月份推出,最终发行版将于2020年Q3面世。如今距离Android...

Android12 支持无线usb调试应用 安卓 usb调试

背景在android12版本中已经支持wifiusb调试了,再也不用查数据线了,下面主要说下连接步骤:1.在开发者启动无线调试...

InstantRun原理--深度剖析AndroidStudio2.0

http://crash.163.com/#news/!newsId=8推荐理由AndroidStudio2.0开始支持InstantRun特性,使得在开发过程中能快速将代码变化更新到设...

集成开发环境Android Studio整合Gemini:可生成、补全代码

IT之家4月9日消息,谷歌近日发布新闻稿,宣布在AndroidStudio中集成Gemini1.0Pro,从而帮助开发人员更快、更好地写出代码。谷歌表示目前相关整合仍处于预览阶段,...

Android studio 最新版本下Gradle的一些配置

当我们把Androidstudio版本更新到Bumblebee版本时,我们会发现创建新的项目时,有了一些改变。项目根目录下面的build.gradle变了:旧版本下的是这样子的:setting.gr...

Android Studio最新版下载安装:Android Studio模拟器怎么启动

目录第一部分:AndroidStudio软件介绍...