——工业智能全场景解决方案专家——工业智能全场景解决方案专家

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

发布时间2025-09-10 09:30:29
分享:

【导语】9月10日,英伟达重磅推出专为大规模上下文处理设计的专用GPU——Rubin CPX,其独立GPU显存达128GB,具备超强计算与注意力能力,将作为Vera Rubin平台一部分于2026年底面世,英伟达称其将为客户带来高效回报。

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

  9 月 10 日消息,英伟达宣布推出新产品Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。

  该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开,英伟达表(biǎo)示(shì),这(zhè)将(jiāng)使(shǐ)整(zhěng)个(gè)过(guò)程(chéng)对(duì)客(kè)户(hù)的(de)效(xiào)率(lǜ)更(gèng)高(gāo)。

  该(gāi)新(xīn)硬(yìng)件(jiàn)预计将作为较大的 Vera Rubin 平台的一部分工作,该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能

  从英伟达新闻稿获悉,独立的 Rubin CPX GPU 包含128GB 的 GDDR7 显存。英伟达承诺,新硬(yìng)件(jiàn)具(jù)有(yǒu) 3 倍(bèi)的(de) attention capabilities,并(bìng)使(shǐ)用(yòng)公(gōng)司(sī)的(de) 4-bit NVFP4 精(jīng)度(dù)提(tí)供(gōng) 30 petaflops 的(de)计(jì)算(suàn)能(néng)力(lì)。

  英(yīng)伟(wěi)达(dá) CEO 黄(huáng)仁(rén)勋(xūn)将(jiāng) Rubin CPX 与(yǔ) RTX 进(jìn)行(xíng)了(le)比(bǐ)较(jiào),他(tā)说(shuō):“正(zhèng)如(rú) RTX 革(gé)新(xīn)了(le)图(tú)形(xíng)和(hé)物(wù)理(lǐ) AI,Rubin CPX 是(shì)首(shǒu)款(kuǎn)专(zhuān)为(wèi)大(dà)规(guī)模(mó)上(shàng)下文 AI 设计的 CUDA GPU,能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报,提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。

  英伟达表示,该硬件将得到其完整软件栈的支持,包括 Nemotron —— 其一系列开放的多模态模型,专为构建企业级 AI 代理(旨在自主处理复杂任务的系统)而设计。Nemotron 模型提供不同尺寸,从 Nano 用于设备端应用,到 Super 用于单 GPU 设置,再到 Ultra 用于大型数据中心。

  英伟达表示,预计 Rubin CPX 将于2026 年底推出



让资产更安全、更经济、更智能
请选择您的行业 水电 新能源 火电 电网 其他
请选择您的行业 水电 新能源 火电 电网 其他
请选择您的行业 水电 新能源 火电 电网 其他
请选择您的行业 水电 新能源 火电 电网 其他
请选择您的行业 水电 新能源 火电 电网 其他
×
咨询电话:400-83756699 咨询邮箱:pocketGames@gsfzw.com
咨询电话:
400-83756699
咨询邮箱:
pocketGames@gsfzw.com
咨询电话:400-83756699 咨询邮箱:pocketGames@gsfzw.com
code1
Hi,有什么问题可以帮您? 立即咨询
Hi,有什么问题可以帮您?
咨询电话:400-83756699 咨询邮箱:pocketGames@gsfzw.com