Hacker News 中文摘要

RSS订阅

OpenAI与博通联合发布LLM优化推理芯片 -- OpenAI and Broadcom unveil LLM-optimized inference chip

文章摘要

OpenAI与博通联合推出首款专为大语言模型推理优化的芯片Jalapeño,性能功耗比显著优于现有产品,从设计到投产仅用九个月,将部署于千兆瓦级数据中心,推动AI更高效、可靠和普及。

文章总结

好的,这是根据您的要求,对原文进行中文重述和精简后的版本:

OpenAI与博通联合发布专为LLM推理优化的芯片

OpenAI与博通公司今日共同发布了其首款智能处理器“Jalapeño”。这是一款专为大型语言模型(LLM)推理而设计的加速器,旨在让先进AI更快、更可靠、更易获取。

核心亮点: * 早期测试显示,其能效比显著优于当前最先进水平。 * 专为当前及未来各行业的LLM从头设计。 * 从设计到生产仅用时9个月,并借助OpenAI模型加速了开发过程。 * 扩展了OpenAI从产品、模型到芯片的全栈平台。 * 计划与数据中心合作伙伴一起,以千兆瓦规模部署多代产品。

设计理念与优势

Jalapeño并非通用加速器,而是基于OpenAI对LLM底层原理的深刻理解,并融合了其模型、内核、服务系统和产品需求而设计的。它与博通和Celestica合作,实现了从芯片到板卡、机架系统的工业化。该芯片设计灵活,能适配各类LLM。目前,工程样品已在实验室中成功运行包括GPT-5.3-Codex-Spark在内的机器学习工作负载。

OpenAI总裁格雷格·布罗克曼表示:“Jalapeño是我们长期全栈基础设施战略的一部分,旨在让计算更充裕,使AI更快、更可靠、更实惠。” 博通总裁兼CEO陈福阳则称:“这是多代产品路线图的开始,我们正与OpenAI共同开发行业领先的硅芯片,从2026年起支持千兆瓦级数据中心的部署。”

全栈优势与加速循环

Jalapeño的设计目标是结合顶级AI加速器的强大吞吐量与专用推理系统的低延迟,使其非常适合大规模交互式LLM产品。这体现了OpenAI的全栈优势:不仅开发前沿模型和产品,还设计底层的芯片、内核、内存、网络等基础设施。每一层都围绕“让模型更快、更可靠、更便宜”这一目标进行优化。

更好的基础设施提升计算效率,进而支持更强大的模型训练和服务,最终催生更好的产品。更好的产品带来更多用户和收入,使OpenAI能持续投资下一代基础设施,形成良性循环,让智能变得更强大、更可靠、更廉价。

快速开发与未来部署

Jalapeño从初始设计到制造流片仅用9个月,这得益于OpenAI工程团队、博通的芯片实现专长,以及OpenAI模型对设计和优化过程的加速。这证明了AI可以帮助工程师更快地设计出更好的芯片,从而降低整个行业的计算成本。

Jalapeño是OpenAI与合作伙伴共同构建的多代计算平台的第一步,计划于2026年底开始初步部署,并在此后持续扩展。

让先进AI更普及

这项工作的核心意义在于:推理是AI触达用户的环节。每一次在成本、速度和可靠性上的改进,都将直接转化为更快的ChatGPT回答、更少等待的Codex任务、更便宜的API产品,或在高需求时更稳定的服务。让AI民主化,意味着让先进模型足够可用、可靠且实惠,让更多人能每天使用。Jalapeño正帮助OpenAI将更多基础设施转化为对用户有用的智能。

评论总结

根据提供的评论内容,仅有一条评论(评分:无,作者:dang),其内容为将评论移至另一链接的提示,未包含具体观点或论据。因此,无法进行多观点总结。如需进一步分析,请提供更多评论内容。