NVLink

NVLink ist ein Hochgeschwindigkeits-Bus von Nvidia, der für den Datentransport zwischen GPU-Knoten und CPUs entwickelt wurde, etwa im Bereich der High-Performance-Workstations und bei Rack-basierten Supercomputern.^[1] Er ersetzt bei neueren Computersystemen auch das SLI-System für die Direkt-Verbindung von Grafikkarten.^[2]

Die folgende Tabelle liefert einen Überblick der Datenrate über eine einzelne Link-Verbindung in einer Richtung. Je nach Halbleiter und Leiterplattenausführung können mehrere solche Links zur Verfügung stehen und auch gebündelt werden.

Interconnect	Transfer- Rate	Datenrate je Lane und Richtung	Lanes pro Link (typisch)	Datenrate je Link und Richtung	Anzahl der Links (Architektur)	Datenrate (kumulativ, bi-direktional)
NVLink 1.0	020 GT/s	~2.500 GByte/s	08	20 GByte/s	04 (Pascal)	160 GByte/s
NVLink 2.0	025 GT/s	~3.125 GByte/s	08	25 GByte/s	06 (Volta)	300 GByte/s
NVLink 3.0^[3]	050 GT/s	~6.250 GByte/s	04	25 GByte/s	12 (Ampere)	600 GByte/s
NVLink 4.0^[4]	050 GT/s	~6,250 GByte/s	04	25 GByte/s	18 (Hopper)	900 GByte/s
NVLink 5.0^[4]	0100 GT/s	~6,250 GByte/s	04	25 GByte/s	18 (Blackwell)	1,8 TByte/s

Eine Bündelung von Lanes ist im Design bzw. den Implementierungen vorgesehen. Dadurch wird die Bandbreite entsprechend vervielfacht. Für die NVLink-Generation 2.0 gibt Nvidia die Volta basierte GPU-Serie mit bis zu 6 Links an, sowie passend eine als NVSwitch bezeichnete, der Generation zugehörige, für Rechenzentrumsanwendungen gedachte Switch-Fabrik für bis zu 16 GPUs. Die ebenfalls mit NVLink-Generation 2.0 ausgestattete Turing-Serie kommt mit bis zu 2 Links. Mit NVLink-Generation 3.0 ist die Ampere GPU-Serie verknüpft was bis zu 12 Links, sowie einen zugehörigen Switch für ebenfalls bis zu 16 GPUs.^[4] Für den Halbleiter Nvidia GV100 mit 6 Lanes NVLink 2.0 ergeben sich in der Board-Ausführung für Rechenzentrum mit der Bezeichnung 'V100 SXM2' damit je 150 GByte/s für eingehende und ausgehende Transfers, also zusammen 300 GByte/s. Die Turing-basierten GPU-Top-Modelle bei denn PCIe-Grafikkarten auf Basis vom Halbleiter Nvidia TU102 bieten dagegen nur 2 Lanes mit entsprechend he 50 GByte/s. Für die Ampere Halbleiter-Generation steht der Halbleiter Nvidia GA100 (etwa verfügbar mit der A100 Karte) für 12 Lanes der NVLink-Generation 3.0 mit je Datenrichtung 300 GByte/s und somit 600 GByte/s gesamt. Derselben Halbleiter- und NVLink-Generation zugehörig ist der Halbleiter Nvidia GA102 wie er in den GPU-Top-Modellen bei den PCIe-Grafikkarten zum Einsatz kommt und dort mit 4 Lanes bei allerdings nur 28,125 GTransfers/s und somit Datenraten je Richtung 56,25 GByte/s oder gesamt 112,5 GByte/s realisiert. Da es sich bei den zuvor genannten Switches effektiv um eine quasi-passiv realisierte Durchleitungsfunktion handelt ist deren Datentransfer-Rate und somit deren Nutzen für den eigentlichen Anwender letztlich durch die daran angebundenen Datenquellen und Senken definiert, so dass sich erst durch ein konkretes Umfeld-Design sinnvolle Angaben zu deren Leistung im System ergeben können.

Einzelnachweise

↑ NVLINK-FABRIC. Abgerufen am 20. August 2019.
↑ Multi-GPU in Spielen: Auch 2 × 16 PCIe-Lanes und NVLink retten SLI nicht. 29. März 2019, abgerufen am 20. August 2019.
↑ https://www.hardwareluxx.de/index.php/news/hardware/grafikkarten/53450-a100-pcie-nvidia-ga100-gpu-kommt-auch-als-pci-express-variante.html
↑ ^a ^b ^c https://www.nvidia.com/de-de/data-center/nvlink/

[1] NVLINK-FABRIC. Abgerufen am 20. August 2019.

[2] Multi-GPU in Spielen: Auch 2 × 16 PCIe-Lanes und NVLink retten SLI nicht. 29. März 2019, abgerufen am 20. August 2019.

[3] ttps://www.hardwareluxx.de/index.php/news/hardware/grafikkarten/53450-a100-pcie-nvidia-ga100-gpu-kommt-auch-als-pci-express-variante.html

[nvlink-4] ttps://www.nvidia.com/de-de/data-center/nvlink/

[1]

[2]

[3]

[4]