Nvidia Quadro RTX A6000 und A40: Ampere für Workstations und Rechenzentren

Nvidias A40 und Quadro RTX A6000 sollen mit voller GA102-GPU, bis zu 40 TFlops und 48 GByte GDDR6 in Rechenzentrum und Workstation für mächtig Dampf sorgen.

13

Nvidia Quadro RTX A6000

(Bild: Nvidia)

05.10.2020, 15:22 Uhr

Lesezeit: 4 Min.

c't Magazin

Von

Carsten Spille

Nvidia Quadro RTX A6000 und A40: Ampere für Workstations und Rechenzentren

Nvidia kündigt Grafikkarten-Typ Nummer 4 und 5 auf Basis der Ampere-Architektur an, wenn man den reinen Rechenzentrums-Beschleuniger A100 nicht mitzählt. Die Quadro RTX A6000 und die Nvidia A40 nutzen den Vollausbau des GA102-Grafikchips, der schon GeForce RTX 3080 und RTX 3090 antreibt. Dabei bleiben die beiden Profi-Karten aber trotz höherer Rechenleistung als die RTX 3090 im Zwei-Slot-Format und bei einer Thermal Design Power (TDP) von 300 Watt.

Klassische Karte, 40 TFLOPS

Die Quadro RTX A6000 ist eine klassische, knapp 27 Zentimeter lange 2-Slot-Karte mit Radiallüfter, der die erwärmte Luft aus dem Gehäuse pustet (Direct Heat Exhaust mit Blower). Die A40 hat keinen Lüfter, sondern soll den üblicherweise starken Luftstrom in Server-Gehäusen nutzen.

Beide Karten verwenden den Vollausbau des GA102-Grafikchips mit 84 Shader-Multiprozessoren und 10.752 Rechenkernen – 2 SMs und 256 Kernchen mehr als das Gaming-Topmodell, die GeForce RTX 3090. Ihre TDP ist bei 300 Watt abgeriegelt, weswegen sie auch mit einem einzelnen Achtpol-Stromanschluss auskommen.

Nvidia gibt im Vorfeld keine Taktraten für den Grafikchip an, wohl aber die mögliche Rechenleistung. Diese wird üblicherweise auf Basis des Boost-Taktes berechnet, der aber gerade bei knappem TDP-Budget womöglich nicht durchweg gehalten werden kann. Die Angaben der gerundeten 40 respektive 38 TFlops sind daher als eher optimistisch zu sehen, liegen aber noch 10 respektive 5 Prozent oberhalb der GeForce RTX 3090, die mit 350 Watt selten unter ihren 1,7-GHz-Boost drosseln muss.

GDDR6 doppelt sicher

Beim Speicher geht Nvidia allerdings auf Nummer sicher – in doppelter Hinsicht. Er fasst auf beiden Karten 48 GByte und ist mit dem Speicherschutz ECC versehen. Zudem handelt es sich "nur" um den herkömmlichen GDDR6-Typ, nicht den neuen GDDR6X, der auf den GeForce-Karten zum Einsatz kommt. Mit GDDR6X wären aktuell aufgrund fehlender 2-GByte-Speicherchips noch keine 48 GByte möglich. Nvidia stattet beide Karten mit den vollen 384 Datenleitungen der integrierten Memory-Controller aus, taktet den RAM aber auf der A40 etwas niedriger. Jeweils zwei Karten lassen sich mit NVLink (aggregierte 112,5 GByte/s) verbinden. Die vollständigen technischen Daten finden Sie in der Tabelle unten.

Auch zur Virtualisierung sollen beide Karten verwendbar sein – unter anderem mit Nvidia Grid, dem Quadro Virtual Data Center Workstation und dem Virtuel Compute Server. Damit lassen sich virtuelle GPUs mit 1, 2, 3, 4, 6, 8, 12, 16, 24 und 48 GByte erstellen. Die Virtualisierung funktioniert allerdings nur bei abgeschalteten Display-Ports. Auf der A40 (wiederum ohne Tesla-Zusatz) sind sie ab Werk abgeschaltet und müssen in der Software erst aktiviert werden, auf der Quadro RTX A6000 ist es andersrum.

Wie schon die Founders Edition der GeForce RTX 3000 verzichtet auch die Quadro RTX A6000 auf den USB-C-Anschluss Virtual Link. Monitore bis zur 8K-Auflösung bindet sie über vier DisplayPorts 1.4 an. Die A40 wird auf Kundenwunsch, die gern auf die aktiv belüfteten Quadros in Rechenzentren verzichten wollten, mit Display-Ausgängen ausgestattet. Allerdings hat sie als passiv gekühlte Karte nur drei DP 1.4a, damit sie den Luftstrom im Server-Gehäuse besser nutzen kann.

Ab Dezember im Handel, OEM-Systeme ab 2021

Die Quadro RTX A6000 soll ab Dezember verfügbar sein, erste OEM-Systeme – wie bei der A40 – sollen Anfang 2021 in den Handel kommen. Preise nannte Nvidia im Vorfeld noch nicht, die Quadro RTX 8000 mit 48 GByte und Turing-Grafikchip kostet zurzeit rund 6000 Euro.

Quadro RTX im Vergleich
	Nvidia Quadro RTX A6000	Nvidia A40	GeForce RTX 3090 FE	GeForce RTX 3080 10 GB FE	GeForce RTX 3070 FE
GPU	Ampere (GA102)	Ampere (GA102)	Ampere (GA102)	Ampere (GA102)	Ampere (GA104)
Graphics Processing Cluster (GPC)	7	7	7	6	6
Shader-Rechenkerne	10752	10752	10496	8704	5888
GPU-/Turbo-Takt	k. A. (Turbo zw. 1837-1883 MHz)	k. A. (Turbo zw. 1744-1790 MHz)	1400 / 1695 MHz	1440 / 1710 MHz	1500 / 1725 MHz
theoretische Rechenleistung FP32	40 TFlops	38 TFlops	35,6 TFlops	29,8 TFlops	20,3 TFlops
Grafikspeicher	48 GByte GDDR6 (ECC)	48 GByte GDDR6 (ECC)	24 GByte GDDR6X	10 GByte GDDR6X	8 GByte GDDR6
Speichertransferrate	768 GByte/s	696 GByte/s	936 GByte/s	760 GByte/s	448 GByte/s
Rasterendstufen	112	112	112	96	96
Raytracing- / Tensor-Kerne	84 / 336	84 / 336	82 / 328	68 / 272	46 / 184
Leistungsaufnahme (Total Graphics Power)	300 Watt	300 Watt	350 Watt	320 Watt	220 Watt
Stromanschlüsse	1 × 8-polig	1 × 8-polig	1 × 12-polig (Adapter auf 2 × 8-Pol)	1 × 12-polig (Adapter auf 2 × 8-Pol)	1 × 8-polig
Systemschnittstelle	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16
Multi-GPU	NVLink (max. 2 Karten)	NVLink (max. 2 Karten)	NVLink (max. 2 Karten)	Nicht unterstützt	Nicht unterstützt
Display-Anschlüsse	Display-Link 1.4 (4)	Display-Link 1.4 (3)	Display-Link 1.4 (3), HDMI 2.1 (1)	Display-Link 1.4 (3), HDMI 2.1 (1)	Display-Link 1.4 (3), HDMI 2.1 (1)
Preis	k. A.	k. A.	1499 Euro (UVP)	699 Euro (UVP)	499 Euro (UVP)

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Preisvergleiche immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(csp)

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}