产品名称:Optimus-1
产品简介:Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让智能体更好地执行复杂任务。
详细介绍:
Optimus-1是什么
Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让智能体更好地执行复杂任务。Optimus-1包含混合多模态记忆模块,由分层有向知识图(HDKG)和抽象多模态经验池(AMEP)组成,知识引导规划器和经验驱动反射器,显著提升在Minecraft等环境中的长期任务性能,接近人类水平。
Optimus-1的主要功能
- 知识引导规划(Knowledge-Guided Planner):基于结构化知识(HDKG)生成可执行的子目标序列,规划和执行长期任务。
- 经验驱动反思(Experience-Driven Reflector):基于历史经验(AMEP)评估当前任务状态,在必要时调整行动计划。
- 行动控制(Action Controller):执行由规划器产生的子目标,与环境互动以完成任务。
- 混合多模态记忆(Hybrid Multimodal Memory):结合HDKG和AMEP,存储和利用世界知识和历史经验,支持复杂决策和适应性学习。
- 自我进化(Self-Evolution):基于“自由探索-教师指导”方法,无需参数更新能逐步提升记忆容量和任务执行能力。
Optimus-1的技术原理
- 分层有向知识图(HDKG):
- 将世界知识(如物品合成规则)转化为图结构,节点代表对象,边代表对象间的关系(如合成关系)。
- 基于图检索和拓扑排序,为智能体提供完成任务所需的材料和工具的知识。
- 抽象多模态经验池(AMEP):
- 动态总结和存储任务执行过程中的多模态信息(如环境、状态、计划、视觉帧等)。
- 用MineCLIP模型计算视觉和子目标的相似性,存储相关性强的视觉记忆,为反思提供参考。
- 知识引导规划器:结合视觉观察和HDKG中的知识,生成合理的子目标序列,指导行动控制器的行动。
- 经验驱动反思器:定期激活,从AMEP中检索与当前子目标相关的多模态经验,评估当前任务状态,决定是继续执行、完成还是需要重新规划。
- 行动控制器:根据子目标和当前观察,生成与环境互动所需的低级行动,如鼠标和键盘操作。
Optimus-1的项目地址
- 项目官网:cybertronagent.github.io/Optimus-1
- GitHub仓库:https://github.com/JiuTian-VL/Optimus-1
- arXiv技术论文:https://arxiv.org/pdf/2408.03615
Optimus-1的应用场景
暂无评论...