首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

IT之家 2025-09-10 07:13:02

A+ A-

英伟达近日宣布推出新产品Rubin CPX，这是一款专为大规模上下文处理而设计的专用GPU，适用于大规模编码和生成视频等高要求工作。该硬件通过将理解AI提示的任务与生成响应的任务区分开来，旨在提高客户效率。

新硬件将是较大Vera Rubin平台的一部分，该平台集成了Vera CPU和Rubin GPU。据英伟达称，全机架版本Vera Rubin NVL144 CPX拥有8 exaflops的AI性能。独立的Rubin CPX GPU配备了128GB GDDR7显存，提供3倍的attention capabilities，并使用公司的4-bit NVFP4精度达到30 petaflops的计算能力。

首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

英伟达CEO黄仁勋将Rubin CPX与RTX进行了对比，指出正如RTX革新了图形和物理AI领域一样，Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU，能够同时推理跨越数百万个知识符号的模型。他还提到，对于企业而言，投资1亿美元部署这种新硬件可能会带来50亿美元的回报。

此外，英伟达表示，这款硬件将得到其完整软件栈的支持，包括Nemotron——一系列开放的多模态模型，专为企业级AI代理设计，能够自主处理复杂任务。Nemotron模型提供多种尺寸选择，从小型设备端应用到大型数据中心解决方案均有覆盖。

预计Rubin CPX将于2026年底上市。

点击查看全文(剩余0%)

首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

热点新闻

精彩推荐