首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布
2025-09-10 09:30:29【导语】9月10日,英伟达重磅推出专为大规模上下文处理设计的专用GPU——Rubin CPX,其独立GPU显存达128GB,具备超强计算与注意力能力,将作为Vera Rubin平台一部分于2026年底面世,英伟达称其将为客户带来高效回报。

9 月 10 日消息,英伟达宣布推出新产品Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。
该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开,英伟达表(biǎo)示(shì),这(zhè)将(jiāng)使(shǐ)整(zhěng)个(gè)过(guò)程(chéng)对(duì)客(kè)户(hù)的(de)效(xiào)率(lǜ)更(gèng)高(gāo)。
该(gāi)新(xīn)硬(yìng)件(jiàn)预计将作为较大的 Vera Rubin 平台的一部分工作,该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。
从英伟达新闻稿获悉,独立的 Rubin CPX GPU 包含128GB 的 GDDR7 显存。英伟达承诺,新硬(yìng)件(jiàn)具(jù)有(yǒu) 3 倍(bèi)的(de) attention capabilities,并(bìng)使(shǐ)用(yòng)公(gōng)司(sī)的(de) 4-bit NVFP4 精(jīng)度(dù)提(tí)供(gōng) 30 petaflops 的(de)计(jì)算(suàn)能(néng)力(lì)。
英(yīng)伟(wěi)达(dá) CEO 黄(huáng)仁(rén)勋(xūn)将(jiāng) Rubin CPX 与(yǔ) RTX 进(jìn)行(xíng)了(le)比(bǐ)较(jiào),他(tā)说(shuō):“正(zhèng)如(rú) RTX 革(gé)新(xīn)了(le)图(tú)形(xíng)和(hé)物(wù)理(lǐ) AI,Rubin CPX 是(shì)首(shǒu)款(kuǎn)专(zhuān)为(wèi)大(dà)规(guī)模(mó)上(shàng)下文 AI 设计的 CUDA GPU,能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报,提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。
英伟达表示,该硬件将得到其完整软件栈的支持,包括 Nemotron —— 其一系列开放的多模态模型,专为构建企业级 AI 代理(旨在自主处理复杂任务的系统)而设计。Nemotron 模型提供不同尺寸,从 Nano 用于设备端应用,到 Super 用于单 GPU 设置,再到 Ultra 用于大型数据中心。
英伟达表示,预计 Rubin CPX 将于2026 年底推出。
热门资讯
猜你喜欢
——工业智能全场景解决方案专家








