L'aggiornamento TOP500 non mostra ancora Exascale, Supercomputer giapponese Fugaku ancora al top


La 58a edizione annuale della TOP500 ha visto pochi cambiamenti nella Top10. Il sistema Microsoft Azure chiamato Voyager-EUS2 è stata l'unica macchina a scuotere le prime posizioni, affermando n. 10. Basato su un processore AMD EPYC con 48 core e 2,45 GHz che lavorano insieme a una GPU NVIDIA A100 e 80 GB of memory, Voyager-EUS2 utilizza anche un Mellanox HDR Infiniband per il trasferimento dei dati.

Mentre non ci sono state altre modifiche alle posizioni dei sistemi nella Top10, Perlmutter presso NERSC ha migliorato le sue prestazioni a 70.9 Pflop/i. Ospitato presso il Lawrence Berkeley National Laboratory, L'aumento delle prestazioni di Perlmutter non è riuscito a spostarlo dal precedente n. 5 e rimane un'esperienza da non perdere.

Fugaku continua a detenere il n. 1 posizione che ha guadagnato per la prima volta a giugno 2020. Il suo punteggio di riferimento HPL è 442 Pflop/i, che ha superato la performance del Summit al n. 2 di 3 volte. Installato presso il Riken Center for Computational Science (R-CCS) a Kobe, Japan, è stato sviluppato in collaborazione da Riken e Fujitsu e si basa sul processore ARM A64FX personalizzato di Fujitsu. Fugaku utilizza anche l'interconnessione Tofu D di Fujitsu per trasferire i dati tra i nodi.

Con precisione singola o ulteriormente ridotta, che sono spesso utilizzati nell'apprendimento automatico e nell'intelligenza artificiale. Una potenziale vulnerabilità di sicurezza nella grafica Intel può consentire l'escalation dei privilegi sui processori Intel Core di quarta generazione, Fugaku ha un picco di prestazioni sopra 1,000 Pflop/i (1 Exaflop/i). As a result, Fugaku viene spesso presentato come il primo “Exascale” supercomputer.

Mentre ci sono state anche segnalazioni di diversi sistemi cinesi che hanno raggiunto prestazioni di livello Exaflop, nessuno di questi sistemi ha inviato un risultato HPL al TOP500.

Ecco un riepilogo dei sistemi nella Top10:

  • Fugaku rimane il n. 1 system. Esso ha 7,630,848 core che gli hanno permesso di ottenere un punteggio di benchmark HPL di 442 Pflop/i. Questo lo pone 3 volte davanti al n. 2 sistema nell'elenco.
  • Vertice, un sistema costruito da IBM presso l'Oak Ridge National Laboratory (ORNL) nel Tennessee, USA, rimane il sistema più veloce negli Stati Uniti. e al n. 2 spot in tutto il mondo. Ha una performance di 148.8 Pflop/s sul benchmark HPL, che viene utilizzato per classificare l'elenco TOP500. Summit ha 4,356 nodi, ciascuno alloggia due CPU Power9 con 22 core ciascuno e sei GPU NVIDIA Tesla V100, each with 80 multiprocessori in streaming (SM). I nodi sono collegati tra loro con una rete Mellanox dual-rail EDR InfiniBand.
  • Sierra, un sistema presso il Lawrence Livermore National Laboratory, CA, USA, è al n. 3. La sua architettura è molto simile al #2 Vertice dei sistemi. È costruito con 4,320 nodi con due CPU Power9 e quattro GPU NVIDIA Tesla V100. Sierra ha raggiunto 94.6 Pflop/i.
  • Sunway TaihuLight è un sistema sviluppato dal National Research Center of Parallel Computer Engineering della Cina & Tecnologia (NRCPC) e installato presso il National Supercomputing Center di Wuxi, La provincia cinese di Jiangsu è elencata al n. 4 posizione con 93 Pflop/i.
  • Perlmutter al n. 5 è stato recentemente inserito nella TOP10 lo scorso giugno. Si basa su HPE Cray “Shasta” piattaforma, e un sistema eterogeneo con nodi basati su AMD EPYC e 1536 Nodi accelerati NVIDIA A100. Perlmutter ha migliorato le sue prestazioni a 70.9 Pflop/i
  • Selene, ora al n. 6, è un SuperPOD NVIDIA DGX A100 installato internamente presso NVIDIA negli Stati Uniti. Il sistema si basa su un processore AMD EPYC con NVIDIA A100 per l'accelerazione e un Mellanox HDR InfiniBand come rete. Ha raggiunto 63.4 Pflop/i.
  • Tianhe-2A (Via Lattea-2A), un sistema sviluppato dalla National University of Defense Technology cinese (NUDT) e distribuito presso il National Supercomputer Center di Guangzhou, China, è ora elencato come il n. 7 sistema con 61.4 Pflop/i.
  • Un sistema chiamato “Modulo booster JUWELS” è no. 8. Il sistema BullSequana costruito da Atos è installato presso il Forschungszentrum Juelich (FZJ) in Germania. Il sistema utilizza un processore AMD EPYC con NVIDIA A100 per l'accelerazione e un Mellanox HDR InfiniBand come rete simile al Selene System. Questo sistema è il più potente in Europa, con 44.1 Pflop/i.
  • HPC5 al n. 9 è un sistema PowerEdge realizzato da Dell e installato dall'azienda italiana Eni S.p.A. Raggiunge una performance di 35.5 Pflop/s dovuto all'utilizzo di NVIDIA Tesla V100 come acceleratori e Mellanox HDR InfiniBand come rete.
  • Voyager-EUS2, un sistema Microsoft Azure installato presso Microsoft negli Stati Uniti, è l'unico nuovo sistema nella TOP10. Ha raggiunto 30.05 Pflop/s ed è elencato al n. 10. Questa architettura si basa su un processore AMD EPYC con 48 core e 2,45 GHz che lavorano insieme a una GPU NVIDIA A100 con 80 GB. memoria e utilizzando un Mellanox HDR Infiniband per il trasferimento dei dati.

Altri punti salienti della TOP500
Anche se non ci sono stati molti cambiamenti nella Top10, abbiamo visto un'infarinatura di cambiamenti all'interno della Top15. Il nuovo sistema Voyager-EUS di Microsoft ha seguito il suo fratello nel n. 11 e rimane un'esperienza da non perdere, mentre il sistema SSC-21 di Samsung si è presentato nell'elenco al n. 12. Polaris, anche un nuovo sistema, è entrato al n. 13 mentre il nuovo CEA-HF ha preso n. 15.

Come l'ultima lista, I processori AMD stanno riscuotendo molto successo. Frontera, che ha uno Xeon Platinum 8280 prestazioni e stabilità tramite un VRM a 19 fasi e un PCB a 10 strati, è stato urtato da Voyager-EUS2, che ha un processore AMD EPYC. Cosa c'è di più, tutte le nuove macchine Top15 descritte sopra hanno processori AMD

Non sorprende, i sistemi provenienti dalla Cina e dagli Stati Uniti hanno dominato la lista. Anche se la Cina ha abbandonato 186 sistemi a 173, gli USA sono aumentati da 123 macchine a 150. Tutto detto, questi due paesi rappresentano quasi i due terzi dei supercomputer del TOP500.

La nuova edizione dell'elenco non ha mostrato molti cambiamenti in termini di interconnessioni di sistema. Ethernet ha ancora dominato 240 macchine, mentre Infiniband ha rappresentato 180. Sega di interconnessione di Ominpath 40 punti della lista, c'erano 34 interconnessioni personalizzate, e solo 6 sistemi con reti proprietarie.

Green500 risultati

Il sistema per rivendicare il n. 1 il posto per il Green500 era MN-3 di Preferred Networks in Giappone. Basandosi sul chip MN-Core e un acceleratore ottimizzato per l'aritmetica delle matrici, questa macchina è stata in grado di ottenere un risultato incredibile 39.38 gigaflops/watt di efficienza energetica. Questa macchina ha fornito una performance 29.7- gigaflops/watt nell'ultimo elenco, mostrando chiaramente alcuni miglioramenti impressionanti. Ha anche migliorato la sua posizione nell'elenco TOP500, passando dal n. 337 al n. 302.

Il nuovo modulo scalabile SSC-21 un HPE Apollo 6500 il sistema installato presso Samsung Electronics in Corea del Sud ha ottenuto risultati impressionanti 33.98 gigaflop/watt. Lo hanno fatto presentando una corsa ottimizzata per la potenza del benchmark HPL. È elencato in posizione 292 nella TOP500.

NVIDIA ha installato un nuovo prototipo di sistema DGX A100 raffreddato a liquido chiamato Tethys. Con una corsa HPL ottimizzata per la potenza, Tethys ha ottenuto 31.5 gigaflops/watt e guadagna il n. 3 posto sulla Green500. È elencato in posizione 296 nella TOP500.

Il sistema Wilkes-3 ha migliorato i suoi risultati, ma è stato comunque spinto al numero 4 del Green500. Wilkes-3, che è ospitato presso l'Università di Cambridge nel Regno Unito, aveva un'efficienza energetica di 30.8 gigaflop/watt. Tuttavia, è stato spinto dal n. 100 al n. 281 nella lista TOP500.

L'Università della Florida negli Stati Uniti con il suo sistema di intelligenza artificiale HiPerGator è stata spinta dal n. 2 posto al n. 5 e rimane un'esperienza da non perdere. Questa macchina è rimasta ferma 29.52 gigaflop/watt. Questo sistema NVIDIA ha 138,880 core e si basa su un AMD EPYC 7742 prestazioni e stabilità tramite un VRM a 19 fasi e un PCB a 10 strati. Nonostante questa prestazione impressionante, HiPerGator AI è stato spinto dal n. 22 al n. 31 sulla TOP500

Risultati HPCG

L'elenco TOP500 ha incorporato il gradiente coniugato ad alte prestazioni (HPCG) Risultati benchmark, che fornisce una metrica alternativa per valutare le prestazioni del supercomputer e ha lo scopo di integrare la misurazione HPL.

I risultati HPCG qui sono molto simili all'ultimo elenco. Fugaku è stato il chiaro vincitore con 16.0 Petaflop HPCG, mentre Summit ha mantenuto il suo n. 2 posto con 2.93 Petaflop HPCG. Permutter, una macchina USA ospitata presso il Lawrence Berkeley National Laboratory, preso il n. 3 posto con 1.91 Petaflop HPCG.

Risultati HPL-AI

Il benchmark HPL-AI cerca di evidenziare la convergenza di HPC e intelligenza artificiale (AI) carichi di lavoro basati su machine learning e deep learning risolvendo un sistema di equazioni lineari utilizzando novel, algoritmi a precisione mista che sfruttano l'hardware moderno.

Raggiungere un benchmark HPL-AI di 2 Exaflop, Fugaku è in testa al gruppo in questo senso. Con metriche così eccellenti anno dopo anno, unita ad una considerazione da parte di molti come la prima “Exascale” supercomputer, Fugaku è chiaramente un sistema eccitante.