Hacker News 中文摘要

RSS订阅

克劳德能开飞机吗? -- Can Claude Fly a Plane?

文章摘要

文章探讨了AI助手Claude尝试通过X-Plane 12 API操控塞斯纳飞机的实验。Claude编写Python脚本实现起飞,但着陆时因延迟问题多次坠毁。实验重点观察AI如何思考自身能力、处理实时事件及预判不同步问题,发现它先编写起飞代码后才考虑转向和着陆策略,展现了AI在实时控制任务中的局限性。

文章总结

标题:Claude能驾驶飞机吗?

2026年4月,有人让Claude研究X-Plane 12的API,尝试驾驶一架塞斯纳172从海南飞往附近地区,并记录飞行日志。以下是Claude在飞行过程中的笔记摘要:

实验过程: 1. 首次尝试:Claude编写了Python脚本控制起飞,但着陆时因角度调整不及时坠毁。它随后改进了控制算法,增加了速率限制和高度保护机制。 2. 第二次飞行:采用纯比例控制器后,飞机成功实现稳定爬升(780英尺/分钟)和巡航(82节),完成了三组90度转弯。但在着陆阶段因控制器间歇性失效(约20秒无指令)导致坠毁。 3. 关键问题:延迟响应(截图与API数据处理的滞后)、控制器参数调校(升降舵增益过高)、以及任务切换时的控制真空期。

技术细节: - 起飞参数:海口美兰机场09跑道,55节抬轮,目标爬升率75节/4500英尺 - 改进方案:取消内环积分项,采用姿态角-升降舵比例控制 - 典型故障:首次爬升时因俯仰角过陡导致速度骤降至125节,滚转60度

结论: 当前版本虽能完成稳定巡航(最远飞行47海里),但尚未实现安全着陆。研究者认为通过改进控制循环和减少指令间隙,Claude有望具备基础飞行能力。这反映了AI在实时事件推理和工具预判方面的潜力,可作为衡量AGI前瞻性思维的基准。

(注:文中配图展示了驾驶舱界面、起飞爬升、失控状态和坠毁场景,为实验过程提供了视觉证据。原文作者表示将继续优化该系统。)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

主要观点与论据

  1. 技术可行性争议

    • 支持方认为AI可以完成基础飞行任务,但需改进:
      • "Flying isn’t hard, autopilots have been around a long time." (jmward01)
      • "would be a good test for different models" (webprofusion)
    • 反对方指出延迟和可靠性问题:
      • "LLM operates in two digit tokens per second... response times in tens of milliseconds" (morpheuskafka)
      • "never leave the controller idle in flight" (ramon156引用实验失败案例)
  2. 与现有自动驾驶对比

    • 现有系统更可靠:
      • "We already have advanced autopilots... I would trust the autopilot more" (operatingthetan)
    • 但LLM可能处理突发情况:
      • "have an LLM focus on recognizing unanticipated situations" (jmward01)
  3. 关键限制因素

    • 延迟问题被多次强调:
      • "delay from what it saw with screenshots and api data" (est)
      • "speed of the input-decision-act loop" (edu)
    • 可靠性担忧:
      • "Prepare for landing 'rate limit exceeded'" (progx)
      • "we don’t trust it to write an email" (hansmayer)
  4. 未来潜力

    • 硬件优化方向:
      • "Taalas-style hardware AI may dominate" (est)
    • 通用能力提升:
      • "Claude’s executive control... improved in a task-agnostic way" (Paracompact)

代表性引用

  • 技术怀疑论: "I wouldn’t trust Claude to ride my bike" (rkagerer) "if can, would you dare to follow it? :D" (xuxu298)

  • 实验细节补充: "The author tried getting Claude to develop an autopilot script" (kqr) "Plane kept descending... until it hit terrain" (ramon156引用)

总结显示:评论者普遍认可基础飞行可行性,但对实时控制能力存疑,认为现有技术更可靠,未来需突破延迟和适应性瓶颈。