Hacker News 中文摘要

RSS订阅

人形机器人执行器 -- Humanoid Robot Actuators

文章摘要

人形机器人执行器面临的核心挑战在于步行动作带来的持续冲击力。每小时5000步、每步承受2-3倍体重的冲击,要求执行器必须具备机械式"让位"能力(反向驱动性),以吸收瞬时冲击能量。传统自锁式执行器会因无法缓冲冲击而导致齿轮箱瞬间剪切破坏,这是当前人形机器人执行器设计的核心工程难题。

文章总结

人形机器人执行器完全工程指南

人形运动的物理学

作者:Firgelli Automations首席工程师兼创始人Robbie Dickson

"一个人形机器人每小时大约行走5000步。每一步都会在腿部执行器中产生2-3倍体重的冲击力——这种力量偶尔承受没问题,但在不间断重复数千次后就会变得具有破坏性。这种持续的工作循环是大多数人形机器人执行器失效的原因,也是幸存者都采用相同工程解决方案的原因。

关键在于,由于这种冲击发生得比任何传感器回路能反应的速度更快(亚毫秒级),执行器必须具备机械上的'屈服能力'(反向驱动性)来吸收能量。如果执行器是机械自锁的——就像大多数工业丝杠那样——齿轮箱将被迫吸收100%的冲击能量,导致立即的剪切失效。"

目录

  1. 行走问题:为何人形机器人会损坏执行器
  2. 质量惩罚螺旋
  3. 趋同解决方案:为何所有主要厂商选择相同路径
  4. 齿轮减速的权衡
  5. 机器人腿内的热现实
  6. 控制架构:从PWM到扭矩控制
  7. 顺应性与串联弹性
  8. 传感与反馈
  9. 为何传统工业执行器会失败
  10. 主决策矩阵:技术与任务匹配
  11. 人形关节执行器的设计要求
  12. 未来:人工肌肉及其他

行走问题:为何人形机器人会损坏执行器

疲劳数学:为何是5000步?

我们提出人形机器人每小时行走约5000步,这不是理论最大值,而是商业可行性的基准。人类快步行走时每分钟约120步,而仓库机器人为了平衡速度与稳定性,通常维持约1.4步/秒(84步/分钟)的稳定步频。

数学揭示了这一工程挑战的严峻性:

84步/分钟 × 60分钟 ≈ 5040次冲击/小时

在8小时工作制中,这累积超过40,000次负载循环。仅一个月运行,人形机器人腿部就要承受约一百万次循环——将标准工业磨损的多年压缩到几周内。

但频率只是问题的一半。冲击强度是另一半。每步都会在腿部执行器中产生2-3倍体重的冲击力。这些力量偶尔承受没问题,但在不间断重复数千次后就会变得具有破坏性。

运输成本:关键效率指标

工程师使用运输成本(CoT)来衡量运动效率——这是一个无量纲比值,表示移动单位重量单位距离所消耗的能量:

CoT = 能量 / (重量 × 距离)

轮式车辆的CoT值在0.01-0.05之间,而双足机器人通常在0.2-0.5之间——效率低10-50倍。

静态力与动态冲击

举起重物与接住下落重物有本质区别。工业执行器通常针对静态或准静态负载进行评级——缓慢施加载荷,机械系统有充足时间分布应力。

行走完全不同。在步态中的脚跟触地阶段,70kg的人形机器人会在大约50-100毫秒内承受1400-2100N的力。

  • 产品规格:假设是稳定提升
  • 现实:每小时5000次接住下落重物

扭矩与力:架构决策

在确定执行器要求前,我们必须解决一个基本设计问题:关节是由旋转执行器还是直线执行器驱动?

对于人形机器人的主要关节(髋、膝、踝、肩、肘),旋转执行器占主导地位。这些通常结合使用稀土磁体的无刷电机来产生高功率旋转输出。

直线执行器用于较小的、次要的运动,紧凑封装比高扭矩更重要。手指驱动是最明显的例子。

特斯拉Optimus、Figure、Agility Digit、Unitree和波士顿动力都使用旋转执行器驱动主要腿部和手臂关节。

真实指标:比扭矩与比力

考虑到质量惩罚,人形执行器的关键性能指标是单位质量的输出。对于驱动主要关节的旋转执行器,这是比扭矩(Nm/kg)。对于次要应用的直线执行器,则是比力(N/kg)。

| 执行器类型 | 典型比力(N/kg) | 是否适合人形 | | --- | --- | --- | | 工业丝杠 | 300-800 | 否 | | 工业滚珠丝杠 | 800-2000 | 勉强 | | 高性能滚珠丝杠 | 2000-3500 | 勉强 | | 行星滚柱丝杠 | 3500-5000+ | 是 | | 液压缸 | 5000-10000+ | 是 |

行走的物理特性形成了一个筛选机制,只有特定的机械设计能够通过。这个筛选机制——以及未能通过的连锁后果——就是我们所说的质量惩罚螺旋。

质量惩罚螺旋

质量惩罚是人形执行器设计中最无情的约束——它同样适用于旋转和直线系统,尽管表现形式不同。

当一个执行器过重时,机器人不仅要承受额外重量。它进入了一个放大原始问题的复合循环。这不是线性关系,而是指数级的。

"指数"计算(实例)

考虑一个设计师为踝关节选择了一个更便宜但重了200g的执行器。

  • 第一步(踝关节):脚部增加200g
  • 第二步(膝关节):膝关节执行器现在需要在杠杆臂(小腿)末端提升这200g。为了处理增加的扭矩,膝关节执行器必须增重350g
  • 第三步(髋关节):髋关节执行器现在需要提升更重的脚(+200g)和更重的膝(+350g)。它必须增重600g
  • 第四步(电池):为这些更大的电机供电,电池组需要增加150g

结果:组件层面200g的误差在系统层面变成了1.3kg的惩罚。机器人变得更慢、效率更低,更容易受到冲击损坏。

惩罚如何不同:旋转vs直线

1. 旋转执行器("反射惯性"陷阱)

对于主要关节(髋、膝、踝、肩、肘)的旋转执行器,质量通过反射惯性影响性能。这是当外部力(如地面)试图移动关节时感受到的阻力。

反射电机惯性的公式是:

J输出 = J转子 × (减速比)²

减速比100:1的齿轮箱不仅将扭矩乘以100;它还将电机自身的惯性从输出端看放大了10,000倍

2. 直线执行器("质量分布"陷阱)

对于用于次要应用(手指、头部定位、躯干关节,在某些设计中包括踝关节)的直线执行器,惩罚是关于质量分布而非反射惯性。

放置在 forearm 驱动手指肌腱的重型直线执行器会将手臂的质量中心向远端(朝向手)移动。前臂每增加一克重量都会被手臂全长作为杠杆放大——肩和肘的旋转执行器现在必须产生更多扭矩才能移动手臂。

连锁故障

刚接触人形设计的新团队常犯致命错误:基于带有"安全系数"的静态负载计算来确定执行器规格。

  • 他们计算静态保持扭矩
  • 增加2倍安全裕度
  • 选择一个重型工业执行器来匹配

结果是一个太重而无法动态行走的机器人。它在空气中"跋涉",仅支撑自身肢体就耗尽电量。

打破循环:目标规格

逃脱螺旋的唯一方法是严格从第一天就执行密度目标:

  • 旋转执行器(主要关节):目标>10 Nm/kg比扭矩
  • 直线执行器(次要运动):目标>4000 N/kg比力

没有"以后升级"的选择。质量预算由执行器决定。在执行器层面选择错误,其他地方的任何优化都无法挽救设计。

趋同解决方案:分离式架构

当特斯拉、Figure和Apptronik等公司专注于建造高负载通用人形机器人时,它们独立得出了相同的执行器架构。类人力量和耐力约束迫使设计者走向一个战略分离:旋转执行器主要用于旋转的关节,直线执行器用于必须吸收重冲击载荷和提升重量的关节。

这不是唯一可行的架构。Unitree的H1和G1使用高扭矩旋转电机驱动膝和髋,优先考虑速度和动态跳跃而非静态重物提升。Agility的Digit使用带有弹簧和缆绳驱动的串联弹性执行器——我们将在第七节探讨的一种独特方法。波士顿动力的电动Atlas代表了另一种变体。

但对于设计用于与人类一起工作、承载载荷并在工业环境中运行的人形机器人,旋转-直线分离已成为主导模式。理解原因需要了解每种执行器类型的内部构造。

旋转执行器内部:谐波齿轮传动

对于主要旋转的关节——肩、腕、髋旋转——现代旋转执行器围绕谐波齿轮传动(常以品牌名"Harmonic Drive"称呼)构建,配合高密度无框电机。

谐波齿轮传动由仅三个部分组成:

  1. 波发生器(输入):连接电机轴的椭圆形插头
  2. 柔轮(输出):一个薄的、可弯曲的金属杯,外缘有齿
  3. 刚轮(固定):一个刚性外环,内部有齿

为何人形机器人使用谐波齿轮传动

  • 零背隙:柔性金属预紧靠外环,创造零游隙
  • 高扭矩密度:相对于其小尺寸和重量产生巨大转动力
  • 单级减速:在单级中实现高减速比,保持执行器扁平紧凑
  • 效率权衡:弯曲金属会产生内部分子摩擦,产生热量

直线执行器内部:行星滚柱丝杠

对于必须吸收重冲击载荷的关节——膝、肘、踝——设计用于负载的人形机器人使用围绕行星滚柱丝杠构建的直线执行器

为何用滚柱丝杠而非滚珠丝杠?

滚珠丝杠在工业机械中无处不在——CNC机床、注塑成型、精密定位系统。为何人形机器人不用它们?答案在于接触几何形状及其对冲击载荷的响应。

  • 滚珠丝杠使用在沟槽中滚动的球形滚珠。每个滚珠与滚道形成点接触——一个集中赫兹应力的微小接触面
  • 滚柱丝杠使用沿长度形成线接触的螺纹滚柱。这将在更大表面积上分布载荷——通常比同等尺寸滚珠丝杠多10-15倍的接触面积

布氏压痕问题

当人形机器人的脚撞击地面时,冲击力通过踝和膝执行器向上传递。这是一个冲击载荷——远超静态评级的突然力峰。

在受冲击载荷的滚珠丝杠中,每个滚珠与滚道之间的点接触承受极端赫兹应力。如果此应力超过材料屈服强度,滚珠会在滚道上产生微小永久凹痕。这称为布氏压痕

一个凹痕几乎察觉不到。但人形机器人每小时行走5000步。每一步都会增加更多微观损伤。几天或几周后,滚道变得粗糙,背隙增大,效率下降,最终丝杠完全失效。

滚柱丝杠能存活是因为线接触将峰值赫兹应力保持在屈服阈值以下,即使在重复冲击载荷下也是如此。

战略分离:执行器与应用匹配

两种执行器类型都不适用于所有场景。每个关节的物理特性决定了选择:

| 关节 | 主要运动 | 典型用例 | 关键挑战 | 执行器类型 | | --- | --- | --- | --- | --- | | 肩旋转 | 旋转 | 手臂定位 | 精度、扭矩密度 | 旋转(谐波) | | 腕 | 旋转 | 工具操作 | 紧凑尺寸、零背隙 | 旋转(谐波) | | 髋旋转 | 旋转 | 转向、侧向移动 | 扭矩密度 | 旋转(谐波) | | 膝 | 伸展/弯曲 | 蹲下、提升、爬楼梯 | 冲击吸收、高力 | 直线(滚柱丝杠) | | 踝 | 伸展/弯曲 | 行走、平衡 | 地面冲击、反向驱动性 | 直线(滚柱丝杠) | | 肘 | 伸展/弯曲 | 提举、搬运 | 负载承载、冲击 | 直线(滚柱丝杠) | | 手指 | 抓握/释放 | 物体操作 | 紧凑封装 | 微型直线 |

谐波齿轮擅长旋转且零背隙,但其柔性金属部件在重复冲击下会疲劳,且较低效率产生热量。行星滚柱丝杠擅长吸收高力密度的直线冲击,但不能高效产生旋转。

趋同解决方案——为提升、搬运和工作设计的人形机器人——在各自表现最佳的地方使用每种执行器类型。这就是为什么特斯拉、Figure和Apptronik的机器人在内部结构上看起来相似。当负载能力是优先考虑时,物理特性几乎没有留下替代架构的空间。

齿轮减速的权衡

机器人学的基本悲剧在于:电机和生物肢体想要相反的东西。一个高效率电机最舒适的是以3000+RPM低扭矩旋转。人类膝盖爬楼梯时大约以30RPM高扭矩运作。

为了弥合这100倍的差距,工程师使用齿轮减速。但齿轮传动不是免费的午餐。它引入了一个不是线性而是指数级增长的惩罚:反射惯性。

N²陷阱:反射惯性

如果在电机上安装100:1减速箱(N=100),你将输出扭矩乘以100。这是好消息。

坏消息是惯性——抵抗速度变化的阻力——从输出端看被乘以减速比的平方(N²)。

J反射 = J转子 × N²

对于100:1减速箱,电机自身的惯性从输出端看感觉重了10,000倍

为何这对行走重要

当机器人脚碰到意外障碍物——石头、台阶边缘、地上的电缆——腿需要立即屈服以吸收冲击。如果减速比过高,电机的反射惯性太大,腿无法快速加速避开。

腿表现得像实心钢棒而非弹性肌肉。冲击力骤增,通常齿轮齿会剪切断裂。

这就是为什么反射惯性方程可以说是执行器设计中最重要的公式。它决定了你的机器人是优雅行走还是在首次接触现实世界时就爆炸。

透明度谱

这创建了一个基于"透明度"的设计谱——电机通过齿轮"感受"环境力的程度,以及环境移动电机的容易程度。

将其视为防火墙:高减速比双向阻挡信息。电机感受不到世界,世界也移动不了电机。这保护了电机但使控制系统失明。

两种竞争方法

1. 准直接驱动(QDD)——"猎豹"方法

使用者:Unitree (H1, G1), MIT Mini Cheetah, 动态跳跃机器人

策略:使用大而扁平的低减速比(6:1至10:1)电机

  • 优点:机器人天生"有弹性"。你可以抓住肢体自由移动——电机以最小阻力旋转。机器人可以仅通过监测电机电流检测地面接触,无需昂贵力传感器。由于低反射惯性允许快速加速,冲击被吸收。
  • 权衡:电机必须物理上大而重以产生足够扭矩,因为齿轮传动提供的机械优势很小。保持静态姿势(如站立不动或持箱)需要消耗大量电流,产生显著热量。

2. 高减速执行器——"举重者"方法

使用者:特斯拉Optimus, Figure, Apptronik Apollo, 工业人形

策略:使用更小、更快的高减速比(50:1至160:1)电机,如谐波齿轮或行星滚柱丝杠

  • 优点:紧凑轻量封装中的巨大力量。机器人可以提起重箱、负重爬楼梯,并保持姿势而不过热电机绕组。保持静态姿势需要更少电流。
  • 权衡:执行器机械上"不透明"。电机无法通过齿轮的摩擦和惯性感受环境力。为实现顺应性,这些机器人需要在输出轴上安装专用扭矩传感器(应变计),加上复杂软件来模拟QDD机器人免费获得的弹性感觉。

QDD vs 高减速:权衡总结

| 特性 | 准直接驱动(6:1–10:1) | 高减速(50:1–160:1) | | --- | --- | --- | | 扭矩密度 | 较低(需要大电机) | 较高(齿轮放大扭矩) | | 反向驱动性 | 优秀(可用手推动) | 差(感觉锁定) | | 抗冲击性 | 优秀(低反射惯性) | 差(高反射惯性) | | 力感应 | 电机电流(免费) | 扭矩传感器(昂贵) | | 静态效率 | 差(保持姿势高电流) | 优秀(齿轮保持位置) | | 最佳适用 | 奔跑、跳跃、敏捷性 | 提举、搬运、工业工作 |

甜蜜点困境

设计者不断寻找"黄金比例"——通常对于通用人形在30:1至50:1之间——执行器足够强大以提升负载,又足够透明以安全行走。

  • 过低(<10:1):机器人敏捷但弱。仅站立就会过热,因为电机必须直接产生所有扭矩。
  • 过高(>100:1):机器人强大但危险。无法感受冲击,移动僵硬,齿轮在冲击载荷下自毁。
  • 甜蜜点(30:1–50:1):足够的扭矩放大以携带有效负载,但反射惯性足够低以保持一定顺应性并承受冲击。

反向驱动性:安全测试

一个简单测试揭示执行器在谱上的位置:你能抓住机器人的手移动它吗?

  • 高减速比:不能。关节感觉锁定。无电源时,机器人保持位置。系统需要力传感器检测你的触碰。
  • 低减速比:可以。关节自由移动。当你推动时电机反向旋转。机器人天生"知道"你在那里,因为它感受到电流变化。

这种区别对安全极为重要。一个可反向驱动的机器人绊倒时会蜷缩并吸收跌落。一个不可反向驱动的机器人绊倒时会像倒下的雕像一样砸向地面(或附近的人)。

"减速比决策在机器人行为的每个方面产生回响——它如何行走、如何跌倒、触摸感觉如何,最终产生多少热量。最后一点将我们引向下一个关键约束:热管理。"

机器人腿内的热现实

虽然齿轮和惯性定义了机器人如何移动,但热力学定义了它能工作多久。人形机器人规格表的一个肮脏秘密是"峰值扭矩"和"连续扭矩"之间的巨大差距。一个机器人可能额定提升50kg,但热力学上它可能仅能维持该负载15秒,然后执行器就会过热。

这不是一个小工程细节——它是区分实验室演示和商业产品的因素。

"零RPM"问题

这一热挑战源于生物学与机电学的根本差异。

当你锁定膝盖站立时

评论总结

以下是评论内容的总结:

  1. 开源机器人执行器推荐

    • 评论1推荐了开源机器人执行器Opentorque actuator,并提供了相关链接。
      "Check out opensource actuator for robots."
      "Opentorque actuator"
  2. 对AI生成内容的质疑

    • 评论2、10、11等对文章使用AI生成内容表示不满,认为这降低了可信度。
      "Why the AI 'engineering expert'? Seems to take some credibility away..."
      "when even the writer is an AI persona, the trust factor gets destroyed."
    • 评论3认为尽管文章使用了AI,但仍包含有用的信息。
      "I think there's enough correct information here for it to be useful..."
  3. 机器人技术的历史与挑战

    • 评论4详细回顾了机器人执行器技术的发展历程,指出资金和工程挑战是关键瓶颈。
      "Progress required hundreds of millions of dollars for all that custom engineering and R&D."
      "It's impressive what's been accomplished in the last five years. It took a lot of money."
  4. 对双足机器人的实用性争议

    • 评论5、6认为双足机器人并非必要,轮式或混合移动方式更实用。
      "Wheels are perfectly ok for majority of city work and factory floor."
      "why you would ever prefer a fully humanoid robot as opposed to a humanoid torso..."
  5. 对文章插图的批评

    • 评论8、11指出文章插图存在严重的机械设计错误,认为这是AI生成内容的典型问题。
      "the article contains some of the worst illustrations I have ever seen."
      "AI slop is not what is accepted here on HN."
  6. 技术细节讨论

    • 评论12提出了关于机器人关节锁定的疑问,建议使用制动装置解决静态负载问题。
      "Why not just add some kind of brake that can fully or partially lock the joint?"
  7. 其他

    • 评论7对页面布局表示不满,评论9以幽默方式询问机器人是否能运行游戏《Doom》。
      "I cannot un-see these left border hints, it's driving me crazy."
      "Do they run Doom?"

总结:评论主要围绕AI生成内容的可信度、机器人执行器技术的历史与挑战、双足机器人的实用性以及文章插图的准确性展开,观点多样且争议较大。