导读 长时间的10月23日,英伟达对外发布了一项最新的研究,在这项研究中表明只需要通过使用ChatGPT不可以轻松的教会机器人学会转笔,这一研究也
长时间的10月23日,英伟达对外发布了一项最新的研究,在这项研究中表明只需要通过使用ChatGPT不可以轻松的教会机器人学会转笔,这一研究也再一次证明ChatGPT以适用于大模型的训练。
从英伟达所发布的相关视频内也可以清晰的看到,这款以OpenAI的GPT-4为基础而打造的Eureka是一款能够做到自动的对实体机器人进行训练的系统,该系统可以在训练实体机器人时,自动对实体机器人去下发动作质量,比如说对动作机器人下发,转笔开抽屉或者是使用剪刀等各种动作较为复杂的指令。除此之外,该系统还拥有可以去编写代码的能力,编写完成的代码系统还可以不断的对代码去进行优化,其先进水平已经完全可以和人类专家相媲美。
英伟达AI高级研究总监Anima Anandkumar再提起这款系统时,向记者表示经过数10年的研究,我们在对系统强化学习方面取得了巨大的成功,但是现在我们依旧面临着很多需要我们去不断改进的困难。比如说系统的奖励设计功能,则需要不断的去进行试验,才能够得出最终的结果,我们所研发的这款新的系统,还有一种新的算法。在投入使用时,这种新的算法也将会使生成式AI和强化学习功能在进行结合时执行率将变得更高。
在机器学习中,智能学习虽然也是属于一种学习的类型,但是这种类型却可以让智能体和环境的学习变得更加的具有效率,获得更多的累积。在不断的进行强化学习的过程中,智能题也需要不停的去从需要学习的环境里面获得更多的状态,以此当做基础去选择一个执行,智能体在执行之后,也将会对智能体给出及时的反馈。