谷歌AI新进展:机器手学会旋转小球,只需训练2.7小时

发布时间:2019-09-30 阅读量:1572 来源: 智东西 发布人: Jane

9月28日消息,近日,谷歌大脑发布了一项深度动力模型成果,能支持机器手做精细的动作。据称,他们的方法能使机器手仅利用三个小时实践获得的数据,就学会旋转小球等动作。

 

谷歌AI新进展1.gif 

 

谷歌新研发的系统是以腾讯、OpenAI等众多相关的AI研究为基础建成的。据称,研究人员打算尽快将代码开源。

 

一、训练2.7小时就会转保定球

 

在研究人员用这套系统执行拾起放任务的过程中,最困难的一项任务是将两个保定球绕着手掌旋转而不掉落,但研究人员的模型仅使用了100,000个(或训练2.7小时)数据点的数据,就能完成这一任务。

 

在一个保定球的分支实验中,该团队改变了模型的用途。结果,该模型无需接受额外的培训,就能完成新的任务,包括将单个球放到目标位置、改变旋转的方向等等。它能成功地将两个球旋转90度和180度,成功率分别为100%和54%。

 

后续测试旨在研究其系统的灵活性,该团队在模拟环境中进行了手写实验。该方法将三维模型与特定任务分离,从而可以将算法沿用到其他的任务中,而不是记住特定任务的答案。

 

二、数据需求小,切换任务也奏效

 

“无物理模型的机器学习方法可以在学习复杂任务上很好地奏效。但是,当任务对机械手的灵活性要求提高时,即使是最先进的这类算法也会遇到困难。”论文合著者写道。

 

“任务联动的复杂性和任务的高失败率都使整体技术更加难以突破。无物理模型方法对数据需求量很大,因此很难在现实世界中使用。在这个项目中,我们旨在突破这种任务复杂性的界限。”

 

最终,团队将所谓的“不确定”的AI模型与最先进的轨迹优化结合起来,使用强化学习训练机器手。

 

每一个动作都会通过机器学习模型被计算下来,作为平均预测的奖励,该模型可用于优化待做动作的序列。机器手只执行第一个动作,然后接收更新的状态信息并在接下来的步骤中重新计划动作。

  

研究人员指出,这种根据反馈重新计划下一次动作的方法具有防止错误累积的优点,能降低误差。此外,使用他们的方法,机器人在中途切换新任务之后,之前的训练数据仍会奏效。

 

三、集腾讯、OpenAI多家之长

 

谷歌新研发的系统是以众多机器手相关的AI研究为基础建成的。

 

其中,包括腾讯近期一项关于五指魔方的立方体求解器研究。另外,OpenAI在去年七月份也介绍了一种系统,它能够以最先进的精度指导机器手抓握和操作对象。

 

去年九月,麻省理工学院CSAIL小组提出了一种名为“ 密集物体网”的计算机视觉系统,该系统使机器人能够检查、看懂并操纵它们没见过的物体。

 

就谷歌自己而言,它在年初就与哥伦比亚普林斯顿大学和麻省理工学院的研究人员合作,开发了一种被称为TossBot的捡拾机器人,能够抓取物体并扔进盒子里。

 

谷歌AI新进展3.gif

 

结语:新方法开创性地使机器手执行灵活任务

 

论文写道:“基于深度模型的方法挑战了惯有的观念,即模型难以学习且尚不能提供像无物理模型方法一样好的控制结果。在我们的操作任务模拟套件中,在学习速度和最终性能方面,它始终优于先前的方法,能开创性地执行很多灵活任务。”

 

“据我们所知我们首次证明,深层神经网络模型确实可以使机械臂高效地利用数据样本,自动探索精细的运动技能。”

 

文章来源:Venture beat

相关资讯
新能源汽车的“核心系统”:深度解析大三电与小三电技术体系

本文将从技术原理、系统架构及工程实现角度,全解剖析新能源汽车的大三电和小三电系统

从汽车电子到多元工业应用:CAN总线技术解析与发展趋势

CAN总线技术通过单一总线替代复杂布线系统,极大提高了系统的可靠性与可维护性

窥见电池灵魂:BMS数据采集如何成为电动时代的神经末梢

数据采集的精度和可靠性,直接决定了整个BMS系统性能的天花板

强强联合!英伟达50亿入股英特尔

英伟达投资50亿入股英特尔股票

​温补晶振(TCXO)核心技术解析:8大关键参数决定系统时序精度​

在高速通信、精准导航与精密测量等尖端领域,电子系统的时序架构对时钟信号稳定性的要求已近乎苛刻——其精度如同机械钟表的游丝摆轮,微小偏差便可能引发整个系统的时序紊乱,导致数据传输错误、定位偏移或测量失准。环境温度的波动一直是普通晶振频率稳定性的最大挑战,而温补晶振(Temperature Compensated Crystal Oscillator,简称TCXO)作为高精度时钟基准的核心器件,正是为解决这一核心问题而生。它凭借内置的“感知-计算-补偿”机制,在宽温环境下实现对频率的精准锁定,将温度变化引发的漂移压制在极低水平,成为高端电子系统中不可或缺的“时序锚点”。要真正理解并选型这一精密器件,就必须深入剖析其决定性能优劣的几个重要参数。