NVIDIA Hopper Whitepaper enthüllt die wichtigsten Spezifikationen des monströsen Rechenprozessors
[ad_1]
Der GH100-Rechenchip basiert auf dem 4 nm-EUV-Prozess, und hat eine monströse Transistorzahl von 80 Milliarden, ein fast 50% Erhöhung gegenüber dem GA100. Interessanterweise aber, bei 814 Kommt in ein, Die Die-Fläche des GH100 ist kleiner als die des GA100, mit 826 mm² sterben auf dem gebaut 7 nm DUV (TSMC-N7) Knoten, alles dank der Transistordichtegewinne des 4 nm-Knoten über die 7 nm eins.
Die Komponentenhierarchie des GH100 ähnelt der von NVIDIA-Architekturen der vorherigen Generation. Die wichtigsten Rechenmaschinen sind verteilt 144 Streaming-Multiprozessoren (SM). Die Chipfunktionen 18,432 FP32 CUDA-Kerne, und 9,216 Doppelte Genauigkeit (FP64) CUDA-Farben. Große Dinge sind zwei 576 Tensor-Kerne der vierten Generation. Einer der GPCs auf dem Silizium verfügt über Rastergrafikhardware, Das Silizium hat also bestimmte GPU-Fähigkeiten.
Das GH100 verfügt über eine 6144-Bit-HBM3-Speicherschnittstelle, und 80 GB ist die Standardspeichergröße für den H100-Rechenprozessor. Die angebotene Speicherbandbreite wird voraussichtlich überschritten 3 TB/s, einschließlich ECC-Unterstützung. Die Host-Schnittstellen erhalten ein großes Upgrade, zu. Das SXM-Formfaktor-Board wird mit der neuesten Generation von NVLink-Verbindungen geliefert 900 GB/s Bandbreite.
Die AIK (Zusatzkarte) Formfaktor-Modell hat PCI-Express 5.0 x16 (128 GB/s). Beide Schnittstellen führen Ressourcen-Pooling-Funktionen ein. Schließlich, NVIDIA treibt die Leistungskurve im Streben nach Leistung nach oben, with the H100 having a typical power value of 700 W, compared to 400 W of the A100. Interessant, the H100 does not max out the GH100 silicon, with the high-density SXM form-factor board featuring 132 von 144 SM, while the PCIe AIC board only has 114 von 144. Both models could come with clock speeds as high as 1.80 GHz.
[ad_2]