破这个问题需

rifat177 · Post by **rifat177** » Thu Dec 26, 2024 8:36 am

所以，在GER（Embodied Agents Research Group），我们的数据策略大致分为三个部分：第一个是互联网数据，比如标签和在线视频。二是模拟数据。我们使用 Nvidia 的模拟工具来生成大量数据合成数据。第三个是实际的机器人数据，我们通过在机器人平台上操作机器人来收集和记录这些数据。我认为成功的机器人策略应该有效地使用这三种类型的数据，将它们整合在一起并提供独特的解决方案。 Sonia Huang 你刚才提到的数据是实现基本机器人模型的一个关键瓶颈。

您能多谈谈您对这个观点的信摩洛哥消费者手机号码列表念以及突？ Jim Fan 好的，我认为我刚才提到的三种不同数据类型各有利弊。首先是互联网数据，它是最多样化的，包含大量的常识性先验知识。例如，网上的大多数视频都以人为中心，因为我们喜欢自拍并记录彼此进行各种活动，而且也有很多学习视频。我们可以利用这些数据来了解人如何与物体交互以及物体在不同情况下的行为方式，这为基本机器人模型提供了常识性先验知识。然而，互联网数据没有动作信号，我们无法从互联网上检索机器人运动控制信号。

这就引出了另一种数据策略，即使用模拟。在模拟中，您可以执行所有操作，并且可以在特定环境中观察这些操作的结果。模拟的优点在于它本质上是无限的数据，并且数据量随着计算资源的增加而增加。投入的 GPU 越多，生成的数据就越多，而且数据是实时的。如果您只收集真实机器人的数据，那么每天的时间就会受到限制。借助 GPU 加速模拟器，我们可以将实时速度加速到超过 .次。我们能够在相同的工作时间内以更高的速度收集数据。但模拟的弱点在于，无论图形管线有多好，模拟与现实之间总会存在差距。