文章摘要
斯坦福大学推出的ToddlerBot是一款低成本、开源的人形机器人平台,旨在支持可扩展的策略学习及机器人学和人工智能研究。该平台具备多种新功能,如动态侧手翻、爬行、快速行走和VR远程操作,展示了其敏捷性和平衡能力。ToddlerBot设计坚固,易于修复,并搭载了实时深度估计技术,适用于广泛的机器人研究与应用。
文章总结
标题:开源机器学习兼容的人形机器人平台ToddlerBot,用于运动与操作研究
主要内容:
斯坦福大学推出的ToddlerBot是一个低成本、开源的人形机器人平台,专为可扩展的策略学习以及机器人和人工智能研究而设计。该平台的最新2.0版本展示了多项新功能,包括动态侧手翻、爬行、更快的行走速度、VR远程操作以及实时深度估计等。
新功能: - 侧手翻: ToddlerBot成功展示了其敏捷性和平衡能力,尽管在初始阶段成功率较低,但机器人非常坚固,即使损坏也易于修复。 - 爬行: 机器人能够像幼儿一样协调使用手臂和腿进行爬行。 - 更快行走: ToddlerBot能够在所有方向上以最高0.25米/秒的速度行走,并以最高1弧度/秒的速度旋转。 - VR远程操作: 支持使用Meta Quest 2进行实时VR远程操作。 - 深度估计: 通过Jetson Orin NX 16GB板载实时(10Hz)立体鱼眼摄像头进行深度估计。
设计: ToddlerBot的机电设计包括30个主动自由度(DoFs),分布在手臂、腿、颈部和腰部。机器人配备了两个末端执行器设计——一个柔性手掌和一个平行夹爪。传感器和电子设备布局包括两个鱼眼摄像头、一个扬声器、两个麦克风、一个IMU和一个Jetson Orin NX计算机。
性能测试: - 臂展、负载和耐力测试: ToddlerBot成功抓取了体积为其躯干14倍的物体,并能够举起其总重量40%的负载。在运行行走策略时,机器人可持续19分钟,最多可承受7次跌落,修复时间仅需21分钟3D打印和14分钟组装。 - 对话、俯卧撑和引体向上: 通过集成OpenAI的Realtime API和GPT-4o,机器人能够进行对话和俯卧撑。引体向上则通过AprilTag精确定位横杆并实现零样本模拟到现实的转移。 - 运动与操作: ToddlerBot实现了全向行走、双手操作和全身操作,并通过60次演示训练的RGB扩散策略进行技能链操作。
可重复性: - 操作策略零样本转移: 成功将在一个ToddlerBot实例上训练的操作策略转移到另一个实例上。 - 双实例协作任务: 两个机器人协作完成了一个长期房间整理任务,展示了其等效性能。 - 易于构建测试: 通过完全开源的组装手册和视频,展示了ToddlerBot的易于构建性。
致谢: 作者感谢Kaizhe Hu在组装第二个ToddlerBot实例和关键帧动画及演示录制中的帮助,以及其他成员在运动、操作策略部署和数学公式方面的贡献。该研究得到了美国国家科学基金会等多个机构的支持。
参考文献:
@article{shi2025toddlerbot,
title={ToddlerBot: Open-Source ML-Compatible Humanoid Platform for Loco-Manipulation},
author={Shi, Haochen and Wang, Weizhuo and Song, Shuran and Liu, C. Karen},
journal={arXiv preprint arXiv:2502.00893},
year={2025}
}
评论总结
评论内容总结如下:
对机器人技术的惊叹与认可
- 评论者普遍对机器人展示的侧手翻动作表示惊叹,认为其技术表现令人印象深刻。
- 引用:
- "The cartwheel is a remarkable demo, I initially thought it was a joke and fake until I saw the blooper reel."(侧手翻是一个非凡的演示,我一开始以为这是个玩笑和假视频,直到看到花絮。)
- "Super impressive work! Can't wait for these to be a little more budget friendly."(非常令人印象深刻的工作!希望它能变得更经济实惠。)
对成本和实用性的关注
- 部分评论者提到当前成本较高,希望有更便宜的版本或入门级选项。
- 引用:
- "Is there a cheaper/starter version, can still use Jetson nano but the rest of the BOM is more starter friendly :)"(有没有更便宜的入门版本,仍然可以使用Jetson nano,但其他材料更友好?)
- "Just seen that 'low cost' means $6k, LMAO."(刚看到“低成本”意味着6000美元,笑死。)
对机器人潜在应用的想象
- 评论者提出了一些有趣的应用场景,如喂猫和取包裹,但也认为这些想法可能过于雄心勃勃。
- 引用:
- "I have visions of buying/building one to feed my cats and bring packages from my porch, is this crazy ambitious?"(我幻想着买或造一个来喂猫和从门廊取包裹,这是不是太疯狂了?)
对技术细节的讨论
- 有评论者提到机器人设计的细节,如3D打印的局限性和双自由度腰部设计。
- 引用:
- "How much of a limitation is it to have the robot be basically 3D-printable?"(机器人基本上是3D打印的,这是多大的限制?)
- "Two DOF for waist! That's some dedication."(腰部有双自由度!真是用心良苦。)
总结:评论者普遍对机器人技术表示惊叹,但也关注其成本和实用性,同时提出了一些有趣的应用场景和技术细节的讨论。