首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

2025-09-10 09:30:29

【导语】9月10日，英伟达重磅推出专为大规模上下文处理设计的专用GPU——Rubin CPX，其独立GPU显存达128GB，具备超强计算与注意力能力，将作为Vera Rubin平台一部分于2026年底面世，英伟达称其将为客户带来高效回报。

首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

　　9 月 10 日消息，英伟达宣布推出新产品Rubin CPX，这是一款专为大规模上下文处理而设计的专用 GPU，涵盖了像大规模编码和生成视频这样要求高的工作。

　　该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开，英伟达表(biǎo)示(shì)，这(zhè)将(jiāng)使(shǐ)整(zhěng)个(gè)过(guò)程(chéng)对(duì)客(kè)户(hù)的(de)效(xiào)率(lǜ)更(gèng)高(gāo)。

　　该(gāi)新(xīn)硬(yìng)件(jiàn)预计将作为较大的 Vera Rubin 平台的一部分工作，该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。

　　从英伟达新闻稿获悉，独立的 Rubin CPX GPU 包含128GB 的 GDDR7 显存。英伟达承诺，新硬(yìng)件(jiàn)具(jù)有(yǒu) 3 倍(bèi)的(de) attention capabilities，并(bìng)使(shǐ)用(yòng)公(gōng)司(sī)的(de) 4-bit NVFP4 精(jīng)度(dù)提(tí)供(gōng) 30 petaflops 的(de)计(jì)算(suàn)能(néng)力(lì)。

　　英(yīng)伟(wěi)达(dá) CEO 黄(huáng)仁(rén)勋(xūn)将(jiāng) Rubin CPX 与(yǔ) RTX 进(jìn)行(xíng)了(le)比(bǐ)较(jiào)，他(tā)说(shuō)：“正(zhèng)如(rú) RTX 革(gé)新(xīn)了(le)图(tú)形(xíng)和(hé)物(wù)理(lǐ) AI，Rubin CPX 是(shì)首(shǒu)款(kuǎn)专(zhuān)为(wèi)大(dà)规(guī)模(mó)上(shàng)下文 AI 设计的 CUDA GPU，能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报，提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。

　　英伟达表示，该硬件将得到其完整软件栈的支持，包括 Nemotron —— 其一系列开放的多模态模型，专为构建企业级 AI 代理（旨在自主处理复杂任务的系统）而设计。Nemotron 模型提供不同尺寸，从 Nano 用于设备端应用，到 Super 用于单 GPU 设置，再到 Ultra 用于大型数据中心。

　　英伟达表示，预计 Rubin CPX 将于2026 年底推出。

上一篇：半年13亿、海外暴增899%！中国玩具巨头靠什么在海外“杀疯”？下一篇：中国移动灵犀智能体产品族全面落地荣耀 AI 手机

返回列表

热门资讯