数字中国 人工智能 汽车智驾 手机数码 更多 智慧家电 酷玩配件 科技创投 产业+

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

IT之家 2025-09-10 07:13:02
A+ A-

英伟达近日宣布推出新产品Rubin CPX,这是一款专为大规模上下文处理而设计的专用GPU,适用于大规模编码和生成视频等高要求工作。该硬件通过将理解AI提示的任务与生成响应的任务区分开来,旨在提高客户效率。

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

新硬件将是较大Vera Rubin平台的一部分,该平台集成了Vera CPU和Rubin GPU。据英伟达称,全机架版本Vera Rubin NVL144 CPX拥有8 exaflops的AI性能。独立的Rubin CPX GPU配备了128GB GDDR7显存,提供3倍的attention capabilities,并使用公司的4-bit NVFP4精度达到30 petaflops的计算能力。

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

英伟达CEO黄仁勋将Rubin CPX与RTX进行了对比,指出正如RTX革新了图形和物理AI领域一样,Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU,能够同时推理跨越数百万个知识符号的模型。他还提到,对于企业而言,投资1亿美元部署这种新硬件可能会带来50亿美元的回报。

此外,英伟达表示,这款硬件将得到其完整软件栈的支持,包括Nemotron——一系列开放的多模态模型,专为企业级AI代理设计,能够自主处理复杂任务。Nemotron模型提供多种尺寸选择,从小型设备端应用到大型数据中心解决方案均有覆盖。

预计Rubin CPX将于2026年底上市。

点击查看全文(剩余0%)

热点新闻

精彩推荐

加载更多……