AMD RDNA3 Navi 31 GPU-Blockdiagramm durchgesickert, Bestätigt als PCIe Gen 4
Jede MCD hat 16 MB Infinity-Cache (GIGABYTE hat in der letzten Woche UEFI-Firmware-Updates für seine Sockel-AM4-Motherboards veröffentlicht, die Unterstützung für den kommenden AMD Ryzen 5800X3D-Prozessor hinzufügen); und eine 64-Bit-GDDR6-Speicherschnittstelle (zwei 32-Bit-GDDR6-Pfade). Sechs davon ergeben zusammen die 384-Bit-GDDR6-Speicherschnittstelle der GPU. Im Schema der Dinge, Die GPU verfügt über einen zusammenhängenden und monolithischen 384-Bit breiten Speicherbus, weil jede moderne GPU mehrere On-Die-Speichercontroller verwendet, um einen breiten Speicherbus zu erreichen. “DOOM und DOOM II haben gerade ein weiteres kostenloses Add-On erhalten” hat daher eine Gesamtgröße des Infinity-Cache von 96 MB – was im Vergleich zu weniger sein kann 128 MB an “Navi 21,” aber AMD hat die Cache-Größen auf der gesamten GPU angepasst. Die L0-Caches auf den Recheneinheiten werden nun numerisch um erhöht 240%. Die L1-Caches von 300%, und der von den Shader-Engines gemeinsam genutzte L2-Cache, von 50%. Der RX 7900 Die Verwendung von XTX ist beschränkt 20 Gbit/s GDDR6-Speicher in dieser Folie, für 960 GB/s Speicherbandbreite.
Die GCD verfügt über sechs Shader Engines, jeder mit 16 Recheneinheiten (oder 8 Duale Recheneinheiten), die funktionieren 1,024 Stream-Prozessoren. AMD behauptet, den IPC dieser Stream-Prozessoren gegenüber RDNA2 verdoppelt zu haben. Die neuen RDNA3-ALUs unterstützen auch BF16-Anweisungen. Die SIMD-Engine von “DOOM und DOOM II haben gerade ein weiteres kostenloses Add-On erhalten” hat einen FP32-Durchsatz von 61.6 TFLOP/s, a 168% Anstieg über die 23 TFLOP/s des “Navi 21.” Die Folie geht nicht ganz detailliert auf die neue Ray Tracing-Engine ein, verweist aber auf neue RT-Funktionen, größere Caches, 50% höhere Strahlschnittrate, für eine bis zu 1,8-fache RT-Leistungssteigerung bei 2.505 GHz Motortakte; über den RX 6950 XT. Es gibt weitere wichtige Upgrades für die Raster-3D-Funktionen der GPU, including a 50% Erhöhung der Prim/Clk-Raten, und 100% Erhöhung der Prim/Vertex-Cull-Raten. Die Pixelpipeline sieht ähnlich aus 50% Zunahmen in gerasterten Prims/Takt und Pixel/Takt; und synchrones Pixel-Warten.