- 2024-6-11
- 技術ニュース, 機械系, 海外ニュース
- 4ビット浮動小数点演算, AI, Blackwell, GPUアーキテクチャ, Hopperアーキテクチャ, NVIDIA, NVLinK, NVLink Switch, TSMC, トランスフォーマーエンジン, 融合積和演算(FMA)
米NVIDIAは2024年3月18日、新しいGPUアーキテクチャ「Blackwell」を発表。台湾セミコンダクター・マニュファクチャリング・カンパニー(TSMC)の4NPプロセスで製造され、総トランジスタ数は2080億個に達する。2022年に市場投入したHopperアーキテクチャと比べて、消費電力当たりの処理性能で最大25倍となっている。
Blackwellは第2世代のトランスフォーマーエンジンを採用し、4ビット浮動小数点演算が可能に。AI処理性能はHopperの5倍となる最大20PFLOPSを達成した。第5世代NVLinKにより、Blackwell Tensorコア GPU 1基で100 GB/秒のNVLink接続を最大18本サポート。帯域幅の合計は1.8 TB/秒となり、Hopperの2倍にあたる。さらにNVLink Switchにより、最大576個のGPUを接続可能だ。
NVIDIAが5月12日に公開したブログ投稿によれば、Blackwellによって科学計算の性能が大幅に向上すると期待できる。例えば、気象予測のシミュレーションに使えば、従来のCPUベースのシステムと比べて、コストは200分の1、消費電力は300分の1に抑えることができるという。デジタルツインのシミュレーションでは、コストは従来比で65分の1、消費電力は58分の1となる。科学/物理関連のシミュレーションにおいてはFP64という倍精度浮動小数点数を使用するが、BlackwellはHopperと比べ、FP64とFP32の融合積和演算(FMA)のパフォーマンスが30%向上したと説明している。
関連情報
NVIDIA Blackwell Platform Arrives to Power a New Era of Computing | NVIDIA Newsroom
NVIDIA Blackwell Platform Pushes the Boundaries of Scientific Computing | NVIDIA Blog
NVLink & NVSwitch: Fastest HPC Data Center Platform | NVIDIA