Description

無盡效能的動力

NVIDIA RTX™ 4000 Ada Generation 是專業人士最強大的單插槽 GPU,與上一代產品相比,在速度和功耗方面實現巨大突破,可在桌上型工作站處理嚴格要求的創意、設計和工程工作流程。 RTX 4000 利用最新一代 RT 核心、Tensor 核心和 CUDA® 核心以及 20GB 繪圖記憶體,使專業人士能夠創造複雜的產品工程、夢幻般的城市景觀和身歷其境的娛樂體驗。 憑藉其高能效的單插槽設計,RTX 4000 可無縫融入各種工作站機箱,為專業人士提供無限潛力。

效能

使用 RTX 4000 Ada Generation 和 RTX A4000 GPU 以及 Intel Core i9-12900K 進行性能測試。 測試基於預發布版本,數字可能會變更。

性能特點

NVIDIA Ada Lovelace 架構

NVIDIA RTX 4000 Ada Generation 是最強大的單插槽工作站 GPU,提供高效能即時光線追踪、AI 加速運算和專業圖形渲染。 NVIDIA Ada Lovelace 架構以強化 Ampere GPU 的主要 SM 為基礎,NVIDIA Ada Lovelace 架構增強了光線追踪運作、張量矩陣以及 FP32 和 INT32 運算的並行處理。

NVIDIA CUDA 核心

與上一代相比,基於 NVIDIA Ada Lovelace 架構的 CUDA 核心的單精度浮點 (FP32) 吞吐量提高了 2 倍,為 3D 模型開發等繪圖工作流程和計算機輔助工程 (CAE) 桌面模擬等工作負載運算,提供了顯著的性能改進。RTX 4000 支援兩條 FP32 主數據路徑,使 FP32 操作峰值加倍。

第三代 RT 核心

基於 NVIDIA Ada Lovelace 架構的 GPU 結合了第三代光線追踪引擎,可提供令人難以置信的光線追踪渲染效能。RTX 4000 可以渲染複雜的專業模型,且具有物理上精確的陰影、反射和折射,使用戶能夠獲得即時洞察結果。基於 RTX 4000 的系統與利用 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光線追踪等 API 的應用程式協同工作,將支援真正的交互式設計工作流程,提供即時反饋,進而實現前所未有的生產力水準。與上一代產品相比,RTX 4000 的光線追踪速度提高了 2 倍。該技術還可以加快光線追踪運動模糊的渲染速度,而以更高的視覺精度更快地獲得結果。

第四代 Tensor 核心

RTX 4000 專為神經網絡訓練和推理功能核心的深度學習矩陣運算而構建,包括增強的Tensor 核心,可加速更多數據類型,並包括新的Fine-Grained Structured Sparsity功能,與上一代相比,可提供高達 4 倍的張量矩陣運算吞吐量。新的 Tensor Core 將加速兩種新的 TF32 和 BFloat16 精度模式。 獨立的浮點和整數數據路徑允許使用計算和尋址計算的組合更有效地執行工作負載。

更高速的 GDDR6 記憶體

RTX 4000 內建 20GB GDDR6 記憶體,提供理想的繪圖佔用空間,可處理對延遲敏感的專業應用程式中的數據集和模型並大批量處理。

第四代 PCIe

RTX 4000 支援 PCI Express Gen 4,它提供的頻寬是 PCIe Gen 3 的兩倍,提高了 CPU 記憶體的資料傳輸速度,適用於 AI 和資料科學等數據密集型任務。

繪圖記憶體上的錯誤修正碼 (ECC)

符合關鍵性任務應用程式對資料完整性的嚴格需求,同時為工作站提供無可比擬的計算精確度和可靠性。

第五代NVDEC引擎1

NVDEC 非常適合用於即時解碼的轉碼和視訊播放應用。 硬體加速解碼支援以下視訊編解碼器:MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1 視訊格式。 專業視訊編輯可以實現 8K/60 的視訊編碼。

第八代 NVENC引擎

NVENC 可以承擔最苛刻的 4K 或 8K 視訊編碼任務,以釋放繪圖引擎和 CPU 用於其他作業。 RTX 4000 提供比軟體式的 x264 編碼器更好的編碼品質。 RTX 4000 採用 AV1 視訊編碼,比 4K HDR 視訊的 H.264 編碼效率高 40%。 AV1 將在相同的位元速率頻寬下提供更好的品質。

圖形搶佔

像素等級搶佔提供更細微的控制,對時間相關的工作支援更佳,例如 VR 動態追蹤。

計算搶佔

指令等級搶佔提供對計算工作更精細的控制,以避免長時間執行的應用程式獨佔系統資源或超時。

RTX IO

使用 Microsoft 新的 DirectStorage for Windows API,與傳統存儲 API 相比,可將基於 GPU 的無損解壓縮性能提高 100 倍,CPU 利用率降低 20 倍。 RTX IO 以更高效、壓縮的形式將資料從存儲裝置移動到 GPU,並提高 I/O 性能。