NVIDIA 於 GTC 2020(GPU 技術大會)正式發表 A100 Tensor 核心 GPU,為 Ampere 架構首次亮相,採用台積電 7nm 製程,搭配 HBM2e(第 3 代 HBM2)記憶體,專為人工智慧、資料分析和高效能運算而設計。總裁黃仁勳則在訪談中證實,該架構也會發行消費級的 GeForce 產品線。
NVIDIA 資料中心 GPU 系列規格
產品 |
A100 |
Tesla V100s |
Tesla V100 |
Tesla V100 |
晶片代號 |
GA100 |
GV100 |
GV100 |
GP100 |
製程 |
7nm |
12nm |
12nm |
16nm |
晶圓面積 |
826 mm^2 |
815 mm^2 |
815 mm^2 |
610 mm^2 |
電晶體數量 |
540 億 |
211 億 |
211 億 |
153 億 |
SM 數量 |
108 |
80 |
80 |
56 |
CUDA 核心數 |
6912 |
5120 |
5120 |
3840 |
Tensor 核心數 |
432 |
640 |
640 |
N/A |
半精度浮點效能 |
78 TeraFLOPS |
32.8 TeraFLOPS |
31.4 TeraFLOPS |
21.2 TeraFLOPS |
單精度浮點效能 |
19.5 TeraFLOPS |
16.4 TeraFLOPS |
15.7 TeraFLOPS |
10.6 TeraFLOPS |
雙精度浮點效能 |
9.7 TeraFLOPS |
8.2 TeraFLOPS |
7.8 TeraFLOPS |
5.3 TeraFLOPS |
Boost 時脈 |
1410 MHz |
1601 MHz |
1533 MHz |
1480MHz |
記憶體形式 |
40GB HBM2e |
32GB HBM2 |
16/32GB HBM2 |
16GB HBM2 |
記憶體介面 |
5120-bit |
4096-bit |
4096-bit |
4096-bit |
等效記憶體速率 |
2430 MHz |
2214 MHz |
1760 MHz |
1408 MHz |
記憶體頻寬 |
1134 GB/s |
1134 GB/s |
900 GB/s |
721 GB/s |
TDP |
400W |
250W |
300W |
300W |
封裝形式 |
SXM4 / PCIe 4.0 |
PCIe 3.0 |
SXM2 / PCIe 3.0 |
SXM |
NVIDIA A100 GPU 內建第 3 代 Tenseor 核心,引進全新的 Tensor Float (TF32) 數據格式,可在完全不變更程式碼的情況下,提供比上一代產品高 20 倍的效能,深度學習訓練和深度學習推論效能則分別提升至上一代的 6 倍/7 倍。
據外媒 MarketWatch 報導,雖然 NVIDIA 從未正式發表有關 Ampere 架構的 GeForce 產品線消息,然而媒體於 GTC 2020 會前訪談中提問企業和消費者應用 Ampere 的方法是否有其區別時,黃仁勳回答道:「架構存在著大量的重疊,但形式則無。」相當於片面證實 GeForce 產品線將導入 Ampere 架構。
會中也同步發表搭載 NVIDIA A100 GPU 的超級電腦 NVIDIA DGX A100,可提供高達 10 PetaOPS 的 INT8、5 PetaFLOPS 的半精度浮點、2.5 PetaFLOPS 的 Tensor Float (TF32),以及 156 TeraFLOPS 的雙精度浮點效能,售 US$199000。