懒人狂喜,会洗衣做饭的家务机器人来了
随着科技的发展,许多家庭电器和工具的出现,使家务变得更加便利和高效。例如,洗碗机、扫地机器人、洗衣机等电器可以帮助人们完成繁重的家务,减轻人们的负担。但是,现代社会的生活节奏加快,许多人都在忙碌的工作和社交生活中奔波,因此有些人还是对琐碎、繁重且需要耗费时间的家务 " 深恶痛绝 "。
为了让做家务变得更加轻松有趣,斯坦福大学打造了 Mobile ALOHA,这是一个创新的家务机器人,专为双手动远程操作而设计,旨在提高烹饪和清洁能力。
跟人抢工作不如帮人做家务
模仿学习在机器人学中显示出巨大的潜力,特别是在桌面操作方面。来自斯坦福大学和谷歌 DeepMind 的研究人员团队通过创建 Mobile ALOHA(一个低成本开源硬件系统,以下简称 "ALOHA")人形系统,在这一领域取得了进展。
这个机器人可以由用户远程操作执行多种活动,并通过模仿学习自主执行。人类操作员通过远程操作控制操作机器人手臂来演示任务。该系统捕获演示数据,并通过端到端的模仿学习来训练控制系统。演示显示,训练有素的机器人烹饪三道菜,并完成精细的任务,如打鸡蛋、切碎大蒜、倒液体、打开蔬菜包装和在煎锅中翻转鸡肉。
ALOHA 还可以完成各种家务任务,包括给植物浇水、使用真空吸尘器、装卸洗碗机、从冰箱里取饮料、开门和操作洗衣机。虽然这些是机器人列出的一些家务,但该开源发明能够完成许多其他尚未宣布的任务,如煮虾或在家里整理东西。
为培训机器人系统提供具有成本效益的解决方案,ALOHA 通过将其安装在轮式底座上来扩展系统。整个设置包括网络摄像头和带有消费级 GPU 的电脑,价格约为 32,000 美元,比现成的双手动机器人便宜得多,后者价格高达 20 万美元。
ALOHA 集成了移动基地和全面的远程操作界面,以实现全身控制。该系统旨在模拟复杂的移动操作任务,这些任务以前使用专注于桌面场景的传统模仿学习技术。ALOHA 的关键特征之一是它能够与已建立的静态 ALOHA 数据集同时训练,这使其与常规机器人系统不同。该系统结合监督行为复刻和每项任务的 50 次演示,实现了令人印象深刻的成功率。
如何拓展家务机器人的智能
最初的 ALOHA 系统使用一种名为 Action Chunking with Transformers(ACT)的架构,该架构从多个视角和联合位置获取图像作为输入,并预测一系列动作。ALOHA 通过输入向量添加运动信号来扩展该系统。
这些操作允许 ALOHA 以最小的更改重用以前的深度模仿学习算法。研究人员写道:" 我们观察到,简单地连接基础和手臂动作,然后通过直接模仿学习进行训练,可以产生强劲的表现……具体来说,我们将 ALOHA 的 14-DoF 联合位置与移动基地的线性和角速度连接起来,形成一个 16 维动作矢量。"
这项工作还受益于最近方法的成功,这些方法在其他项目的各种机器人数据集上预训练模型。特别值得注意的是 RT-X,这是 DeepMind 和 33 个研究机构的一个项目,它结合了几个机器人数据集,创建了可以超越其训练数据和机器人形态的通用控制系统。
研究人员写道:" 尽管在任务和形态上存在差异,但我们观察到几乎所有移动操作任务的正转移,与仅使用 ALOHA 数据训练的策略相比,实现了同等或更好的性能和数据效率……通过协同训练,我们能够在这些任务上取得超过 80% 的成功,每项任务只需 50 次人类演示,与没有协同训练相比,平均绝对改善 34%。"
另外,ALOHA 一个关键创新是谷歌在机器人导航和地图方面的进步。ALOHA 能够使用摄像头和传感器识别家具、物体和墙壁,从而构建室内空间的动态地图。它能够在地图中定位自己,并规划最优路径进行导航。机器学习使得机器人能够随着时间的推移,在收集更多感知数据后,改进其地图和导航能力。
总结
基于 ALOHA 引发的轰动,Mobile ALOHA 项目联合负责人 Tony Z. Zhao 亲自在 X(原推特)上放出 ALOHA 执行任务失败的视频,并称 " 机器人还没有准备好接管世界!" 虽然机器人厨师的能力确实给人留下了深刻的印象,但仍不完美,它也会把事情弄糟,而且其笨重外形不适合严密的环境。再者,其学习新知识仍然需要人类操作员在环境中进行全面演示。
即便如此,这依旧是机器人系统的重大发展。未来,研究人员计划通过增加更多自由度和减少机器人体积来改进系统,并探索人工智能模型的变化,这将使机器人能够自我改进并获得新知。