导读 加州大学伯克利分校的研究人员开发出一种新的方法,教机器人进行“基于视觉的追踪”,实现像捉人游戏等需要动态决策的任务。这种方法不同于简单地跟踪一个人或机器人,机器
中华网9月6日消息:近日,加州大学伯克利分校的研究人员开发出一种新方法,可以教会机器人进行“基于视觉的跟踪”,以实现标签游戏等动态任务。 决策任务。
这种方法不同于简单地跟踪人或机器人,机器人可以主动推断目标的行踪并追捕它。 由于现实世界的各种限制,例如对环境和其他智能体的感知有限,很难直接通过强化学习来学习此类行为。
因此,研究人员使用了“特权学习”。 这是监督学习的一种形式,其中具有附加信息的教师帮助没有附加信息的学生。
对于机器人来说,这意味着机器人老师利用逃避者未来的轨迹来推断逃避者的意图。 有了这些特权信息,机器人教师可以逐步指导学生机器人采取哪些行动。 因此,本质上复杂的规划问题对于学生来说变成了一个简单的监督学习问题。
尽管这种方法很简单,但机器人可以学习动态行为,例如在目标转动时减速,或者预测目标的去向并拦截它。
研究人员在四足机器人上测试了该方法,该机器人仅依靠内置摄像头和本体感觉,成功地与人类和其他机器人玩追逐游戏。 该机器人还展示了模型在模拟环境中学到的复杂追踪行为。
这种“特权学习”方法教会机器人执行基于视觉的跟踪,从而实现捉迷藏等复杂的动态任务,这是机器人技术向现实世界应用迈出的一步。
但目前该系统无法处理障碍,需要更广泛的人工智能训练和更好的传感器。