Hacker News 中文摘要

RSS订阅

纳米代码：200美元能买到的最佳Claude纯JAX TPU代码 -- Nanocode: The best Claude Code that $200 can buy in pure JAX on TPUs

原文链接 | HN讨论 | 2026-04-06 05:25:54

文章摘要

文章介绍了名为"nanocode"的Claude代码项目，号称是"200美元能买到的最佳Claude代码"。该项目由salmanmohammadi在GitHub上发布，主要涉及AI代码创建和开发者工作流程等内容。

文章总结

介绍nanocode：价值200美元的最佳Claude代码项目

项目概述

项目名称：nanocode
开发者：salmanmohammadi
核心目标：展示如何从零开始训练一个类似Anthropic Claude的代码生成模型，采用Constitutional AI（宪法AI）方法，通过JAX实现并优化TPU训练。
技术栈：基于JAX框架，适配Google TPU（兼容NVIDIA GPU），训练成本低至34美元（小模型）或200美元（1.3B参数模型）。

关键特点

训练流程
- 预训练：混合使用FineWeb-Edu和The Stack-V2数据集，优化代码分词效率。
- 工具调用模板：定义Read、Edit、Grep、Bash等工具接口，支持模型与UNIX环境交互。
- 宪法AI对齐：通过合成数据生成和偏好优化（DPO），使模型遵循自定义行为准则（SOUL.md）。
性能数据
- 1.3B参数模型（d24）：训练耗时9小时，成本200美元，代码处理效率显著优于通用文本模型。
- 对比基准：在CORE指标上接近GPT-2 XL水平，但专为代码任务优化。
实际应用
- 提供交互式命令行工具，支持多轮对话和文件操作（如搜索、编辑代码）。
- 示例：模型可修复Python文件语法错误，或通过grep定位代码中的TODO注释。

开发者体验

快速上手：利用Google TRC计划免费获取TPU资源，或使用新用户300美元云积分。
可扩展性：代码库仅5.5K行，鼓励用户自定义SOUL和行为模板。
工具支持：内置训练日志分析和HTML报告生成脚本。

局限性与未来

小模型对复杂任务（如多步骤Bug修复）表现有限。
作者建议进一步开发针对性评估工具，优化更大模型的宪法对齐效果。

项目链接：GitHub仓库
数据集示例：Hugging Face

（注：原文中大量导航菜单、登录提示等非核心内容已省略，聚焦技术实现和项目价值。）

评论总结

评论总结：

对付费训练编码模型的质疑

主要观点：质疑为何要付费训练模型，当存在免费替代品时
关键引用： "Why would people want to spend $200 to train a coding model when there are free coding models?"（为什么要花200美元训练编码模型，当有免费模型时？）

对技术文章的评价

主要观点：赞赏文章对机器学习初学者的友好性
关键引用： "As someone with zero ML experience, this was a super interesting and digestible read!"（作为零ML经验者，这篇文章非常有趣且易于理解！）

对生成代码正确性的讨论

主要观点：指出示例代码存在错误，未按要求修改原列表
关键引用： "Is the generated python code in the example wrong?"（示例中的Python代码是否错误？） "list comprehension, which makes a new list and leaves the original unmodified"（列表推导式创建了新列表而未修改原列表）

对术语使用的批评

主要观点：批评"训练Claude Code"的说法不准确
关键引用： "It cannot be 'trained'."（它不能被"训练"） "annoyed by the imprecise use of terminology"（对术语使用不精确感到恼火）

相关工具提醒

主要观点：提醒不要混淆不同工具
关键引用： "Not to be confused with nanocoder, the agentic coding harness."（不要与nanocoder这个代理编码工具混淆）

对技术可行性的质疑

主要观点：询问该方法是否真的有效及是否符合Anthropic的实际工作原理
关键引用： "Does this really work? Does this how Anthropic works?"（这真的有效吗？Anthropic是这样工作的吗？）