Nvidia Quadro RTX A6000 und A40: Ampere für Workstations und Rechenzentren
Nvidias A40 und Quadro RTX A6000 sollen mit voller GA102-GPU, bis zu 40 TFlops und 48 GByte GDDR6 in Rechenzentrum und Workstation für mächtig Dampf sorgen.
Nvidia kündigt Grafikkarten-Typ Nummer 4 und 5 auf Basis der Ampere-Architektur an, wenn man den reinen Rechenzentrums-Beschleuniger A100 nicht mitzählt. Die Quadro RTX A6000 und die Nvidia A40 nutzen den Vollausbau des GA102-Grafikchips, der schon GeForce RTX 3080 und RTX 3090 antreibt. Dabei bleiben die beiden Profi-Karten aber trotz höherer Rechenleistung als die RTX 3090 im Zwei-Slot-Format und bei einer Thermal Design Power (TDP) von 300 Watt.
Klassische Karte, 40 TFLOPS
Die Quadro RTX A6000 ist eine klassische, knapp 27 Zentimeter lange 2-Slot-Karte mit Radiallüfter, der die erwärmte Luft aus dem Gehäuse pustet (Direct Heat Exhaust mit Blower). Die A40 hat keinen Lüfter, sondern soll den üblicherweise starken Luftstrom in Server-Gehäusen nutzen.
Beide Karten verwenden den Vollausbau des GA102-Grafikchips mit 84 Shader-Multiprozessoren und 10.752 Rechenkernen – 2 SMs und 256 Kernchen mehr als das Gaming-Topmodell, die GeForce RTX 3090. Ihre TDP ist bei 300 Watt abgeriegelt, weswegen sie auch mit einem einzelnen Achtpol-Stromanschluss auskommen.
Nvidia gibt im Vorfeld keine Taktraten für den Grafikchip an, wohl aber die mögliche Rechenleistung. Diese wird üblicherweise auf Basis des Boost-Taktes berechnet, der aber gerade bei knappem TDP-Budget womöglich nicht durchweg gehalten werden kann. Die Angaben der gerundeten 40 respektive 38 TFlops sind daher als eher optimistisch zu sehen, liegen aber noch 10 respektive 5 Prozent oberhalb der GeForce RTX 3090, die mit 350 Watt selten unter ihren 1,7-GHz-Boost drosseln muss.
GDDR6 doppelt sicher
Beim Speicher geht Nvidia allerdings auf Nummer sicher – in doppelter Hinsicht. Er fasst auf beiden Karten 48 GByte und ist mit dem Speicherschutz ECC versehen. Zudem handelt es sich "nur" um den herkömmlichen GDDR6-Typ, nicht den neuen GDDR6X, der auf den GeForce-Karten zum Einsatz kommt. Mit GDDR6X wären aktuell aufgrund fehlender 2-GByte-Speicherchips noch keine 48 GByte möglich. Nvidia stattet beide Karten mit den vollen 384 Datenleitungen der integrierten Memory-Controller aus, taktet den RAM aber auf der A40 etwas niedriger. Jeweils zwei Karten lassen sich mit NVLink (aggregierte 112,5 GByte/s) verbinden. Die vollständigen technischen Daten finden Sie in der Tabelle unten.
Auch zur Virtualisierung sollen beide Karten verwendbar sein – unter anderem mit Nvidia Grid, dem Quadro Virtual Data Center Workstation und dem Virtuel Compute Server. Damit lassen sich virtuelle GPUs mit 1, 2, 3, 4, 6, 8, 12, 16, 24 und 48 GByte erstellen. Die Virtualisierung funktioniert allerdings nur bei abgeschalteten Display-Ports. Auf der A40 (wiederum ohne Tesla-Zusatz) sind sie ab Werk abgeschaltet und müssen in der Software erst aktiviert werden, auf der Quadro RTX A6000 ist es andersrum.
Wie schon die Founders Edition der GeForce RTX 3000 verzichtet auch die Quadro RTX A6000 auf den USB-C-Anschluss Virtual Link. Monitore bis zur 8K-Auflösung bindet sie über vier DisplayPorts 1.4 an. Die A40 wird auf Kundenwunsch, die gern auf die aktiv belüfteten Quadros in Rechenzentren verzichten wollten, mit Display-Ausgängen ausgestattet. Allerdings hat sie als passiv gekühlte Karte nur drei DP 1.4a, damit sie den Luftstrom im Server-Gehäuse besser nutzen kann.
Ab Dezember im Handel, OEM-Systeme ab 2021
Die Quadro RTX A6000 soll ab Dezember verfügbar sein, erste OEM-Systeme – wie bei der A40 – sollen Anfang 2021 in den Handel kommen. Preise nannte Nvidia im Vorfeld noch nicht, die Quadro RTX 8000 mit 48 GByte und Turing-Grafikchip kostet zurzeit rund 6000 Euro.
Quadro RTX im Vergleich | |||||
Nvidia Quadro RTX A6000 | Nvidia A40 | GeForce RTX 3090 FE | GeForce RTX 3080 10 GB FE | GeForce RTX 3070 FE | |
GPU | Ampere (GA102) | Ampere (GA102) | Ampere (GA102) | Ampere (GA102) | Ampere (GA104) |
Graphics Processing Cluster (GPC) | 7 | 7 |
7 |
6 |
6 |
Shader-Rechenkerne |
10752 |
10752 |
10496 | 8704 | 5888 |
GPU-/Turbo-Takt |
k. A. (Turbo zw. 1837-1883 MHz) |
k. A. (Turbo zw. 1744-1790 MHz) |
1400 / 1695 MHz | 1440 / 1710 MHz | 1500 / 1725 MHz |
theoretische Rechenleistung FP32 | 40 TFlops | 38 TFlops | 35,6 TFlops | 29,8 TFlops | 20,3 TFlops |
Grafikspeicher | 48 GByte GDDR6 (ECC) | 48 GByte GDDR6 (ECC) | 24 GByte GDDR6X | 10 GByte GDDR6X | 8 GByte GDDR6 |
Speichertransferrate |
768 GByte/s | 696 GByte/s | 936 GByte/s | 760 GByte/s | 448 GByte/s |
Rasterendstufen | 112 | 112 | 112 | 96 | 96 |
Raytracing- / Tensor-Kerne | 84 / 336 | 84 / 336 | 82 / 328 | 68 / 272 | 46 / 184 |
Leistungsaufnahme (Total Graphics Power) |
300 Watt | 300 Watt | 350 Watt | 320 Watt | 220 Watt |
Stromanschlüsse | 1 × 8-polig | 1 × 8-polig | 1 × 12-polig (Adapter auf 2 × 8-Pol) | 1 × 12-polig (Adapter auf 2 × 8-Pol) | 1 × 8-polig |
Systemschnittstelle | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
Multi-GPU | NVLink (max. 2 Karten) | NVLink (max. 2 Karten) |
NVLink (max. 2 Karten) |
Nicht unterstützt | Nicht unterstützt |
Display-Anschlüsse | Display-Link 1.4 (4) | Display-Link 1.4 (3) | Display-Link 1.4 (3), HDMI 2.1 (1) | Display-Link 1.4 (3), HDMI 2.1 (1) | Display-Link 1.4 (3), HDMI 2.1 (1) |
Preis | k. A. | k. A. | 1499 Euro (UVP) | 699 Euro (UVP) | 499 Euro (UVP) |
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
(csp)