應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

首款專為大規(guī)模上下文 AI 設(shè)計的 CUDA GPU,英偉達(dá) Rubin CPX 發(fā)布

2025-09-10 09:13 IT之家
關(guān)鍵詞:英偉達(dá)RubinCPX

導(dǎo)讀:英偉達(dá)宣布推出新產(chǎn)品Rubin CPX,這是一款專為大規(guī)模上下文處理而設(shè)計的專用 GPU,涵蓋了像大規(guī)模編碼和生成視頻這樣要求高的工作。

  9 月 10 日消息,英偉達(dá)宣布推出新產(chǎn)品Rubin CPX,這是一款專為大規(guī)模上下文處理而設(shè)計的專用 GPU,涵蓋了像大規(guī)模編碼和生成視頻這樣要求高的工作。

  該硬件旨在將理解 AI 提示的任務(wù)與生成響應(yīng)的任務(wù)區(qū)分開,英偉達(dá)表示,這將使整個過程對客戶的效率更高。

  該新硬件預(yù)計將作為較大的 Vera Rubin 平臺的一部分工作,該平臺同時集成了 Vera CPU 和 Rubin GPU。英偉達(dá)聲稱全機(jī)架版本 Vera Rubin NVL144 CPX 擁有 8 exaflops 的 AI 性能。

  從英偉達(dá)新聞稿獲悉,獨立的 Rubin CPX GPU 包含128GB 的 GDDR7 顯存。英偉達(dá)承諾,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的計算能力。

  英偉達(dá) CEO 黃仁勛將 Rubin CPX 與 RTX 進(jìn)行了比較,他說:“正如 RTX 革新了圖形和物理 AI,Rubin CPX 是首款專為大規(guī)模上下文 AI 設(shè)計的 CUDA GPU,能夠在同一時間推理跨越數(shù)百萬個知識符號的模型?!彼€試圖量化客戶的投資回報,提到部署新硬件的 1 億美元投資可以產(chǎn)生 50 億美元的收益。

  英偉達(dá)表示,該硬件將得到其完整軟件棧的支持,包括 Nemotron —— 其一系列開放的多模態(tài)模型,專為構(gòu)建企業(yè)級 AI 代理(旨在自主處理復(fù)雜任務(wù)的系統(tǒng))而設(shè)計。Nemotron 模型提供不同尺寸,從 Nano 用于設(shè)備端應(yīng)用,到 Super 用于單 GPU 設(shè)置,再到 Ultra 用于大型數(shù)據(jù)中心。

  英偉達(dá)表示,預(yù)計 Rubin CPX 將于2026 年底推出