Nvidia新AI系統能訓練機器手轉筆、開抽屜等動作

图片来源:

Nvidia

Nvidia上周宣布以OpenAI GPT-4为基础的AI系统Eureka的开发成果，能训练实体机器人执行复杂动作，像是转笔、开抽屉。

Eureka是Nvidia研究院AI演算法的开发成果。Eureka本身是以Open AI GPT-4为基础，可提供开发人员配合Nvidia的物理模拟参考应用程式Isaac Gym进行强化学习（reference learning）。Issac Gym则是以Nvidia 3D工具及应用程式的开发平台Omniverse为基础开发。

Nvidia AI研究部门资深总监Anima Anandkumar指出，强化学习过去10年虽然有所进展，但仍存在不少挑戦，像是奖赏设计，现在都还停留在「尝试错误」阶段。Eureka则是为执行困难的任务而设计，结合生成式与强化式学习的演算法开发的首次尝试。

Eureka生成出的奖赏程式可从事机器人的尝试错误（trial-and-error）学习，并执行80%人类专家的任务，能使平均效能提升超过50%。根据Nvidia公布的影片，Eureka训练的机器人能执行将近30种任务，像是转笔、两手互传球、开抽屉或拿剪刀等。

图片来源_Nvidia

Eureka利用GPT-4 LLM和生成式AI撰写出程式码，奖赏机器人手臂或手指进行强化式学习，过程中不需要输入任务提示或撰写预定义的奖赏范本，再结合人类回馈修正奖赏，使执行结果更精准符合开发人员的视觉。

在Issac Gym中，利用GPU加速的模拟，Eureka可针对大量批次的候选回馈快速评估品质，以提升训练效率。然后Eureka可根据训练结果的关键统计做出摘要，再命令LLM改良奖赏功能的生成。AI可以自我改进，教导所有类型的机器人，包括兽型（四脚）、人型（两脚）、四轴、手爪式及协作手臂等机器人来完成所有任务。

这篇研究也公布了研究小组根据开源灵敏性标竿测试，评估20种任务训练结果，这些测试要求机器手做多种复杂技能动作。

Nvidia表示Eureka结合LLM和Nvidia GPU模拟技术的产物，相信它可实现灵巧的机器人控制，并为动画作者提供生成逼真实体动作的新方法。

Nvidia研究院之前也发表过Voyager，后者是以GPT-4打造能自己玩《Minecraft》的AI系统。

Nvidia上周也宣布和甲骨文云端服务的进一步合作。继今年3月及7月缔结生成式AI服务及超级电脑服务DGX Cloud搬上甲骨文云基础架构（Oracle Cloud Infrastructure，OCI）后，现在Nvidia DGX Cloud及Nvidia AI Enterprise软体服务，已经在服务市集上架，提供OCI客户采购。

Nvidia新AI系统能训练机器手转笔、开抽屉等动作