因为他经常旅行,所以我们称他为 Voyager。因此,这是我们团队创建与虚拟世界交互的实体代理的最早尝试之一。 Sonia Huang 说到您刚才提到的课程生成机制,我发现这非常有趣,因为这似乎是推理和法学硕士领域尚未完全解决的问题之一。如何让这些模型知道下一步要改进什么?您能多谈谈如何构建课程生成和推理吗?吉姆·范肯定是。我认为这些最先进的模型表现出一个非常有趣的新兴特性,因为它们能够思考自己的行为,并且似乎知道自己已经掌握了什么和尚未掌握什么,并且可以相应地建议任务。
在 Voyager 中,我们为代 比利时手机号码列表 理设置了一个高级指目标,没有说明首先要发现哪些物品或首先解锁哪些工具。代理通过编码、提示和技能库自行发现它们。这个系统的工作原理令人惊奇,我认为这是拥有强大的推理引擎后自然而然的一个功能。 Sonia Huang 您认为为什么如此多的虚拟世界研究都集中在虚拟世界上?我相信,许多深度学习研究人员不仅喜欢玩电子游戏,尽管这可能也有一点帮助。
您认为解决虚拟世界中的问题与物理世界中的问题有什么关系?两者如何相互影响? Jim Fan 是的,我一直认为游戏和机器人之间有很多相似的原理。对于具身智能体来说,它们的输入是感官信息,例如视频流和一些感官输入,它们的输出是动作。在游戏中,可以是键盘和鼠标动作,而在机器人中,运动控制处于较低水平。所以从API的角度来看,两者是相似的。这些代理必须探索世界,并在某种程度上自行收集数据。但不同之处在于,机器人技术更加困难,因为你必须弥合模拟与现实之间的差距。