NVLink
NVLink ist ein Hochgeschwindigkeits-Bus von Nvidia, der für den Datentransport zwischen GPU-Knoten und CPUs entwickelt wurde, etwa im Bereich der High-Performance-Workstations und bei Rack-basierten Supercomputern.[1] Er ersetzt bei neueren Computersystemen auch das SLI-System für die Direkt-Verbindung von Grafikkarten.[2]
Die folgende Tabelle liefert einen Überblick der Datenrate über eine einzelne Link-Verbindung in einer Richtung. Je nach Halbleiter und Leiterplattenausführung können mehrere solche Links zur Verfügung stehen und auch gebündelt werden.
Interconnect | Transfer- Rate |
Datenrate je Lane und Richtung |
Lanes pro Link (typisch) |
Datenrate je Link und Richtung |
Anzahl der Links (Architektur) |
Datenrate (kumulativ, bi-direktional) |
---|---|---|---|---|---|---|
NVLink 1.0 | 20 GT/s | ~2.5 | GByte/s8 | 20 GByte/s | 4 (Pascal) | 160 GByte/s |
NVLink 2.0 | 25 GT/s | ~3.125 GByte/s | 8 | 25 GByte/s | 6 (Volta) | 300 GByte/s |
NVLink 3.0[3] | 50 GT/s | ~6.25 | GByte/s4 | 25 GByte/s | 12 (Ampere) | 600 GByte/s |
NVLink 4.0[4] | 50 GT/s | ~6,25 | GByte/s4 | 25 GByte/s | 18 (Hopper) | 900 GByte/s |
NVLink 5.0[4] | 100 GT/s | ~6,25 | GByte/s4 | 25 GByte/s | 18 (Blackwell) | 1,8 TByte/s |
Eine Bündelung von Lanes ist im Design bzw. den Implementierungen vorgesehen. Dadurch wird die Bandbreite entsprechend vervielfacht. Für die NVLink-Generation 2.0 gibt Nvidia die Volta basierte GPU-Serie mit bis zu 6 Links an, sowie passend eine als NVSwitch bezeichnete, der Generation zugehörige, für Rechenzentrumsanwendungen gedachte Switch-Fabrik für bis zu 16 GPUs. Die ebenfalls mit NVLink-Generation 2.0 ausgestattete Turing-Serie kommt mit bis zu 2 Links. Mit NVLink-Generation 3.0 ist die Ampere GPU-Serie verknüpft was bis zu 12 Links, sowie einen zugehörigen Switch für ebenfalls bis zu 16 GPUs.[4] Für den Halbleiter Nvidia GV100 mit 6 Lanes NVLink 2.0 ergeben sich in der Board-Ausführung für Rechenzentrum mit der Bezeichnung 'V100 SXM2' damit je 150 GByte/s für eingehende und ausgehende Transfers, also zusammen 300 GByte/s. Die Turing-basierten GPU-Top-Modelle bei denn PCIe-Grafikkarten auf Basis vom Halbleiter Nvidia TU102 bieten dagegen nur 2 Lanes mit entsprechend he 50 GByte/s. Für die Ampere Halbleiter-Generation steht der Halbleiter Nvidia GA100 (etwa verfügbar mit der A100 Karte) für 12 Lanes der NVLink-Generation 3.0 mit je Datenrichtung 300 GByte/s und somit 600 GByte/s gesamt. Derselben Halbleiter- und NVLink-Generation zugehörig ist der Halbleiter Nvidia GA102 wie er in den GPU-Top-Modellen bei den PCIe-Grafikkarten zum Einsatz kommt und dort mit 4 Lanes bei allerdings nur 28,125 GTransfers/s und somit Datenraten je Richtung 56,25 GByte/s oder gesamt 112,5 GByte/s realisiert. Da es sich bei den zuvor genannten Switches effektiv um eine quasi-passiv realisierte Durchleitungsfunktion handelt ist deren Datentransfer-Rate und somit deren Nutzen für den eigentlichen Anwender letztlich durch die daran angebundenen Datenquellen und Senken definiert, so dass sich erst durch ein konkretes Umfeld-Design sinnvolle Angaben zu deren Leistung im System ergeben können.
Einzelnachweise
Bearbeiten- ↑ NVLINK-FABRIC. Abgerufen am 20. August 2019.
- ↑ Multi-GPU in Spielen: Auch 2 × 16 PCIe-Lanes und NVLink retten SLI nicht. 29. März 2019, abgerufen am 20. August 2019.
- ↑ https://www.hardwareluxx.de/index.php/news/hardware/grafikkarten/53450-a100-pcie-nvidia-ga100-gpu-kommt-auch-als-pci-express-variante.html
- ↑ a b c https://www.nvidia.com/de-de/data-center/nvlink/