Ampere架構NVIDIA A100 GPU正式亮相，確認發行GeForce產品線

2020年5月14日星期四下午9:30:34 [台北標準時間]

羽神翼

NVIDIA A100

NVIDIA 於 GTC 2020（GPU 技術大會）正式發表 A100 Tensor 核心 GPU，為 Ampere 架構首次亮相，採用台積電 7nm 製程，搭配 HBM2e（第 3 代 HBM2）記憶體，專為人工智慧、資料分析和高效能運算而設計。總裁黃仁勳則在訪談中證實，該架構也會發行消費級的 GeForce 產品線。

NVIDIA 資料中心 GPU 系列規格

產品	A100	Tesla V100s	Tesla V100	Tesla V100
晶片代號	GA100	GV100	GV100	GP100
製程	7nm	12nm	12nm	16nm
晶圓面積	826 mm^2	815 mm^2	815 mm^2	610 mm^2
電晶體數量	540 億	211 億	211 億	153 億
SM 數量	108	80	80	56
CUDA 核心數	6912	5120	5120	3840
Tensor 核心數	432	640	640	N/A
半精度浮點效能	78 TeraFLOPS	32.8 TeraFLOPS	31.4 TeraFLOPS	21.2 TeraFLOPS
單精度浮點效能	19.5 TeraFLOPS	16.4 TeraFLOPS	15.7 TeraFLOPS	10.6 TeraFLOPS
雙精度浮點效能	9.7 TeraFLOPS	8.2 TeraFLOPS	7.8 TeraFLOPS	5.3 TeraFLOPS
Boost 時脈	1410 MHz	1601 MHz	1533 MHz	1480MHz
記憶體形式	40GB HBM2e	32GB HBM2	16/32GB HBM2	16GB HBM2
記憶體介面	5120-bit	4096-bit	4096-bit	4096-bit
等效記憶體速率	2430 MHz	2214 MHz	1760 MHz	1408 MHz
記憶體頻寬	1134 GB/s	1134 GB/s	900 GB/s	721 GB/s
TDP	400W	250W	300W	300W
封裝形式	SXM4 / PCIe 4.0	PCIe 3.0	SXM2 / PCIe 3.0	SXM

NVIDIA A100 GPU 內建第 3 代 Tenseor 核心，引進全新的 Tensor Float (TF32) 數據格式，可在完全不變更程式碼的情況下，提供比上一代產品高 20 倍的效能，深度學習訓練和深度學習推論效能則分別提升至上一代的 6 倍／7 倍。

據外媒 MarketWatch 報導，雖然 NVIDIA 從未正式發表有關 Ampere 架構的 GeForce 產品線消息，然而媒體於 GTC 2020 會前訪談中提問企業和消費者應用 Ampere 的方法是否有其區別時，黃仁勳回答道：「架構存在著大量的重疊，但形式則無。」相當於片面證實 GeForce 產品線將導入 Ampere 架構。

會中也同步發表搭載 NVIDIA A100 GPU 的超級電腦 NVIDIA DGX A100，可提供高達 10 PetaOPS 的 INT8、5 PetaFLOPS 的半精度浮點、2.5 PetaFLOPS 的 Tensor Float (TF32)，以及 156 TeraFLOPS 的雙精度浮點效能，售 US$199000。

NVIDIA GTC 2020 — 由於 DGX A100 效能極高，可大量節省部署成本，總裁黃仁勳甚至表示：「買越多，省越多！」

Tags: #NVIDIA #A100 #Ampere #7nm #TSMC

科技硬體