La mise à jour TOP500 ne montre pas encore d'exascale, Le supercalculateur japonais Fugaku toujours au top


La 58e édition annuelle du TOP500 a vu peu de changement dans le Top10. Le système Microsoft Azure appelé Voyager-EUS2 a été la seule machine à secouer les premières places, prétendant Non. 10. Basé sur un processeur AMD EPYC avec 48 cœurs et 2,45 GHz fonctionnant avec un GPU NVIDIA A100 et 80 Go de mémoire, Voyager-EUS2 utilise également un Mellanox HDR Infiniband pour le transfert de données.

Bien qu'il n'y ait pas eu d'autres changements dans les positions des systèmes dans le Top10, Perlmutter au NERSC a amélioré ses performances pour 70.9 Pflop/s. Installé au Lawrence Berkeley National Laboratory, L'augmentation des performances de Perlmutter ne pouvait pas le déplacer de son précédent Non. 5 place.

Fugaku continue de détenir le No. 1 position qu'il a obtenue pour la première fois en juin 2020. Son score de référence HPL est 442 Pflop/s, qui a dépassé la performance de Summit at No. 2 par 3x. Installé au Riken Center for Computational Science (R-CCS) à Kobé, Japan, il a été co-développé par Riken et Fujitsu et est basé sur le processeur ARM A64FX personnalisé de Fujitsu. Fugaku utilise également l'interconnexion Tofu D de Fujitsu pour transférer des données entre les nœuds.

En précision simple ou encore réduite, qui sont souvent utilisés dans l'apprentissage automatique et l'IA. application, Fugaku a une performance de pointe au-dessus 1,000 PFlop/s (1 Exaflop/s). As a result, Fugaku est souvent présenté comme le premier “Exascale” supercalculateur.

Bien qu'il y ait également eu des rapports sur plusieurs systèmes chinois atteignant des performances de niveau Exaflop, aucun de ces systèmes n'a soumis de résultat HPL au TOP500.

Voici un résumé des systèmes dans le Top10:

  • Fugaku reste le Non. 1 système. Il a 7,630,848 cœurs qui lui ont permis d'atteindre un score de référence HPL de 442 Pflop/s. Cela le place 3 fois devant le Non. 2 système dans la liste.
  • Sommet, un système construit par IBM au laboratoire national d'Oak Ridge (ORNL) dans le Tennessee, USA, remains the fastest system in the U.S. and at the No. 2 spot worldwide. It has a performance of 148.8 Pflop/s sur le benchmark HPL, qui est utilisé pour classer la liste TOP500. Sommet a 4,356 nœuds, each housing two Power9 CPUs with 22 cores each and six NVIDIA Tesla V100 GPUs, each with 80 La prochaine carte graphique phare de NVIDIA (S.M.). Les nœuds sont reliés entre eux par un réseau EDR InfiniBand à double rail Mellanox.
  • Sierra, un système au Lawrence Livermore National Laboratory, CA, USA, is at No. 3. Son architecture ressemble beaucoup à celle #2 systems Summit. Il est construit avec 4,320 nodes with two Power9 CPUs and four NVIDIA Tesla V100 GPUs. Sierra atteint 94.6 Pflop/s.
  • Sunway TaihuLight is a system developed by China’s National Research Center of Parallel Computer Engineering & La technologie (NRCPC) et installé au National Supercomputing Center de Wuxi, China’s Jiangsu province is listed at the No. 4 poste avec 93 Pflop/s.
  • Perlmutter chez Non. 5 was newly listed in the TOP10 in last June. It is based on the HPE Cray “Shasta” Plate-forme, and a heterogeneous system with AMD EPYC based nodes and 1536 Nœuds accélérés NVIDIA A100. Perlmutter improved its performance to 70.9 Pflop/s
  • Selene, now at No. 6, is an NVIDIA DGX A100 SuperPOD installed in-house at NVIDIA in the USA. The system is based on an AMD EPYC processor with NVIDIA A100 for acceleration and a Mellanox HDR InfiniBand as a network. It achieved 63.4 Pflop/s.
  • Tianhe-2A (Voie Lactée-2A), un système développé par l'Université nationale de technologie de la défense de Chine (NUDT) et déployé au National Supercomputer Center de Guangzhou, China, is now listed as the No. 7 system with 61.4 Pflop/s.
  • A system calledJUWELS Booster Moduleis No. 8. The BullSequana system build by Atos is installed at the Forschungszentrum Juelich (FZJ) in Germany. The system uses an AMD EPYC processor with NVIDIA A100 for acceleration and a Mellanox HDR InfiniBand as a network similar to the Selene System. This system is the most powerful system in Europe, avec 44.1 Pflop/s.
  • HPC5 at No. 9 is a PowerEdge system built by Dell and installed by the Italian company Eni S.p.A. It achieves a performance of 35.5 Pflop/s due to using NVIDIA Tesla V100 as accelerators and a Mellanox HDR InfiniBand as the network.
  • Voyager-EUS2, a Microsoft Azure system installed at Microsoft in the U.S., is the only new system in the TOP10. It achieved 30.05 Pflop/s and is listed at No. 10. This architecture is based on an AMD EPYC processor with 48 cores and 2.45GHz working together with an NVIDIA A100 GPU with 80 G.B. mémoire et utilisant un Mellanox HDR Infiniband pour le transfert de données.

Autres temps forts du TOP500
Bien qu'il n'y ait pas eu beaucoup de changements dans le Top10, nous avons vu quelques changements au sein du Top15. Le nouveau système Voyager-EUS de Microsoft a suivi son frère dans le No. 11 place, tandis que le système SSC-21 de Samsung s'est présenté à la liste au n °. 12. Polaris, également un nouveau système, est arrivé à Non. 13 tandis que le nouveau CEA-HF prenait No. 15.

Comme la dernière liste, Les processeurs AMD connaissent beaucoup de succès. Frontière, qui a un Xeon Platinum 8280 processeur, a été heurté par Voyager-EUS2, qui a un processeur AMD EPYC. Quoi de plus, toutes les nouvelles machines Top15 décrites ci-dessus ont des processeurs AMD

Sans surprise, les systèmes de Chine et des États-Unis dominaient la liste. Bien que la Chine soit passée de 186 des systèmes à 173, les États-Unis sont passés de 123 machines à 150. En tout, ces deux pays concentrent près des deux tiers des supercalculateurs du TOP500.

La nouvelle édition de la liste n'a pas présenté beaucoup de changements en termes d'interconnexions système. Ethernet toujours dominé à 240 machines, alors qu'Infiniband représentait 180. Scie d'interconnexion Ominpath 40 places sur la liste, Il y avait 34 interconnexions personnalisées, and only 6 systèmes avec réseaux propriétaires.

Résultats Green500

Le système pour réclamer le Non. 1 spot pour le Green500 était MN-3 de Preferred Networks au Japon. S'appuyant sur la puce MN-Core et un accélérateur optimisé pour l'arithmétique matricielle, cette machine a pu réaliser un incroyable 39.38 rendement énergétique en gigaflops/watt. Cette machine a fourni une performance 29.7- gigaflops/watt sur la dernière liste, montrant clairement une amélioration impressionnante. Il a également amélioré sa position sur la liste TOP500, passant de Non. 337 à Non. 302.

Le nouveau module évolutif SSC-21 et HPE Apollo 6500 système installé chez Samsung Electronics en Corée du Sud a réalisé un impressionnant 33.98 gigaflops/watt. Ils l'ont fait en soumettant une version optimisée de la puissance du benchmark HPL. Il est répertorié à la position 292 dans le TOP500.

NVIDIA a installé un nouveau système prototype refroidi par liquide DGX A100 appelé Tethys. Avec un cycle HPL optimisé en termes de puissance, Tethys a atteint 31.5 gigaflops/watt et garne rouge le Non. 3 place sur le Green500. Il est répertorié à la position 296 dans le TOP500.

Le système Wilkes-3 a amélioré ses résultats mais a tout de même été repoussé à la quatrième place du Green500. Wilkes-3, qui se trouve à l'Université de Cambridge au Royaume-Uni., avait une efficacité énergétique de 30.8 gigaflops/watt. Cependant, il a été poussé de Non. 100 à Non. 281 sur la liste TOP500.

L'Université de Floride aux États-Unis avec son système HiPerGator AI a été poussée du No. 2 place au Non. 5 place. Cette machine est restée stable à 29.52 gigaflops/watt. Ce système NVIDIA a 138,880 cœurs et s'appuie sur un AMD EPYC 7742 processeur. Malgré ces performances impressionnantes, HiPerGator AI est passé de Non. 22 à Non. 31 sur le TOP500

Résultats HPCG

La liste TOP500 a incorporé le gradient conjugué haute performance (HPCG) Résultats de référence, qui fournissent une métrique alternative pour évaluer les performances des supercalculateurs et sont destinées à compléter la mesure HPL.

Les résultats HPCG ici sont très similaires à la dernière liste. Fugaku a été le grand gagnant avec 16.0 HPCG-pétaflops, tandis que Summit a conservé son Non. 2 place avec 2.93 HPCG-pétaflops. Perlmutter, une machine américaine hébergée au Lawrence Berkeley National Laboratory, a pris le non. 3 place avec 1.91 HPCG-pétaflops.

Résultats HPL-AI

Le benchmark HPL-AI cherche à mettre en évidence la convergence du HPC et de l'intelligence artificielle (IA) charges de travail basées sur l'apprentissage automatique et l'apprentissage en profondeur en résolvant un système d'équations linéaires à l'aide de nouveaux, algorithmes de précision mixte qui exploitent le matériel moderne.

Atteindre un benchmark HPL-AI de 2 Exaflops, Fugaku est en tête du peloton à cet égard. Avec des mesures aussi excellentes année après année, combiné avec une considération par beaucoup comme le premier “Exascale” supercalculateur, Fugaku est clairement un système passionnant.