Designprobleme können die Einführung der Advanced Blackwell AI Chips von NVIDIA verzögern


Aufgrund von Designproblemen kann es bei NVIDIA zu Verzögerungen bei der Veröffentlichung seiner neuesten Chips für künstliche Intelligenz kommen, laut anonymen Quellen, die an der Herstellung von Chip- und Server-Hardware beteiligt sind und von The Information zitiert werden. Die Verzögerung könnte sich auf drei Monate oder mehr erstrecken, potenziell große Kunden wie Meta betreffen, Google, und Microsoft. Ein ungenannter Microsoft-Mitarbeiter und eine andere Quelle behaupten, NVIDIA habe Microsoft bereits über Verzögerungen informiert, die die fortschrittlichsten Modelle der Blackwell AI-Chipserie betreffen. As a result, Größere Lieferungen werden erst im ersten Quartal erwartet 2025.

Wenn ich um einen Kommentar gebeten werde, Ein NVIDIA-Sprecher ging nicht auf die Kommunikation mit Kunden bezüglich der Verzögerung ein, erklärte dies jedoch “Die Produktion ist auf dem Weg zum Hochlauf” noch in diesem Jahr. Die Informationen berichten, dass Microsoft, Google, Amazon Web Services, und Meta lehnte es ab, sich zu der Angelegenheit zu äußern, während Taiwan Semiconductor Manufacturing Company (TSMC) reagierte nicht auf Anfragen.

Update1:

Das Produktionsproblem wurde vom Hersteller TSMC entdeckt, Dabei handelt es sich um den Prozessorchip, der zwei Blackwell-GPUs auf einem GB200 verbindet.” – über Dynamik von Rechenzentren

NVIDIA muss seinen Chip neu gestalten, Vor der Massenproduktion ist ein neuer TSMC-Produktionstest erforderlich. Gerüchten zufolge erwägen sie eine Single-GPU-Version, um die Lieferung zu beschleunigen. Aufgrund der Verzögerung stehen die Produktionslinien von TSMC vorübergehend still.

Aktualisieren 2:

Dylan Patel von SemiAnalysis berichtet in einem Nachricht auf Twitter (weiß jetzt als X) dass das Blackwell-Angebot im vierten Quartal deutlich geringer ausfallen wird als erwartet 2024 und H1 2025. Dieser Mangel ist auf den Übergang von TSMC von der CoWoS-S- zur CoWoS-L-Technologie zurückzuführen, erforderlich für die fortschrittlichen Blackwell-Chips von NVIDIA. Aktuell, Die AP3-Verpackungsanlage von TSMC ist der CoWoS-S-Produktion gewidmet, während die erste CoWoS-L-Kapazität in der AP6-Anlage installiert wird.

Zusätzlich, NVIDIA scheint der Produktion von GB200-NVL72-Einheiten Vorrang vor NVL36-Einheiten zu geben. Die GB200 NVL36-Konfigurationsfunktionen 36 GPUs in einem einzigen Rack mit 18 einzelne GB200-Rechenknoten. Im Gegensatz, Das NVL72-Design beinhaltet 72 GPUs, entweder in einem einzigen Rack mit 18 Doppelte GB200-Rechenknoten oder auf zwei Racks verteilt, jeweils enthaltend 18 einzelne Knoten.