文章摘要
文章探讨了AI助手Claude尝试通过X-Plane 12 API操控塞斯纳飞机的实验。Claude编写Python脚本实现起飞,但着陆时因延迟问题多次坠毁。实验重点观察AI如何思考自身能力、处理实时事件及预判不同步问题,发现它先编写起飞代码后才考虑转向和着陆策略,展现了AI在实时控制任务中的局限性。
文章总结
标题:Claude能驾驶飞机吗?
2026年4月,有人让Claude研究X-Plane 12的API,尝试驾驶一架塞斯纳172从海南飞往附近地区,并记录飞行日志。以下是Claude在飞行过程中的笔记摘要:
实验过程: 1. 首次尝试:Claude编写了Python脚本控制起飞,但着陆时因角度调整不及时坠毁。它随后改进了控制算法,增加了速率限制和高度保护机制。 2. 第二次飞行:采用纯比例控制器后,飞机成功实现稳定爬升(780英尺/分钟)和巡航(82节),完成了三组90度转弯。但在着陆阶段因控制器间歇性失效(约20秒无指令)导致坠毁。 3. 关键问题:延迟响应(截图与API数据处理的滞后)、控制器参数调校(升降舵增益过高)、以及任务切换时的控制真空期。
技术细节: - 起飞参数:海口美兰机场09跑道,55节抬轮,目标爬升率75节/4500英尺 - 改进方案:取消内环积分项,采用姿态角-升降舵比例控制 - 典型故障:首次爬升时因俯仰角过陡导致速度骤降至125节,滚转60度
结论: 当前版本虽能完成稳定巡航(最远飞行47海里),但尚未实现安全着陆。研究者认为通过改进控制循环和减少指令间隙,Claude有望具备基础飞行能力。这反映了AI在实时事件推理和工具预判方面的潜力,可作为衡量AGI前瞻性思维的基准。
(注:文中配图展示了驾驶舱界面、起飞爬升、失控状态和坠毁场景,为实验过程提供了视觉证据。原文作者表示将继续优化该系统。)
评论总结
以下是评论内容的总结,平衡呈现不同观点并保留关键引用:
主要观点与论据
技术可行性争议
- 支持方认为AI可以完成基础飞行任务,但需改进:
- "Flying isn’t hard, autopilots have been around a long time." (jmward01)
- "would be a good test for different models" (webprofusion)
- 反对方指出延迟和可靠性问题:
- "LLM operates in two digit tokens per second... response times in tens of milliseconds" (morpheuskafka)
- "never leave the controller idle in flight" (ramon156引用实验失败案例)
- 支持方认为AI可以完成基础飞行任务,但需改进:
与现有自动驾驶对比
- 现有系统更可靠:
- "We already have advanced autopilots... I would trust the autopilot more" (operatingthetan)
- 但LLM可能处理突发情况:
- "have an LLM focus on recognizing unanticipated situations" (jmward01)
- 现有系统更可靠:
关键限制因素
- 延迟问题被多次强调:
- "delay from what it saw with screenshots and api data" (est)
- "speed of the input-decision-act loop" (edu)
- 可靠性担忧:
- "Prepare for landing 'rate limit exceeded'" (progx)
- "we don’t trust it to write an email" (hansmayer)
- 延迟问题被多次强调:
未来潜力
- 硬件优化方向:
- "Taalas-style hardware AI may dominate" (est)
- 通用能力提升:
- "Claude’s executive control... improved in a task-agnostic way" (Paracompact)
- 硬件优化方向:
代表性引用
技术怀疑论: "I wouldn’t trust Claude to ride my bike" (rkagerer) "if can, would you dare to follow it? :D" (xuxu298)
实验细节补充: "The author tried getting Claude to develop an autopilot script" (kqr) "Plane kept descending... until it hit terrain" (ramon156引用)
总结显示:评论者普遍认可基础飞行可行性,但对实时控制能力存疑,认为现有技术更可靠,未来需突破延迟和适应性瓶颈。