La actualización TOP500 aún no muestra una exaescala, La supercomputadora japonesa Fugaku sigue en la cima
Si bien no hubo otros cambios en las posiciones de los sistemas en el Top10, Perlmutter en NERSC mejoró su desempeño a 70.9 pflops/s. Ubicado en el Laboratorio Nacional Lawrence Berkeley, El mayor rendimiento de Perlmutter no pudo moverlo de su anterior No. 5 lugar.
Fugaku continúa sosteniendo el No. 1 posición que obtuvo por primera vez en junio 2020. Su puntaje de referencia HPL es 442 pflops/s, que superó el desempeño de Summit en No. 2 por 3x. Instalado en el Riken Center for Computational Science (R-CCS) en Kobe, Japan, fue desarrollado conjuntamente por Riken y Fujitsu y se basa en el procesador ARM A64FX personalizado de Fujitsu. Fugaku también utiliza la interconexión Tofu D de Fujitsu para transferir datos entre nodos.
En precisión simple o más reducida, que se utilizan a menudo en el aprendizaje automático y la IA. solicitud, Fugaku tiene un rendimiento máximo arriba 1,000 PFlop/s (1 exaflop/s). Como resultado, Fugaku se presenta a menudo como el primero “Exaescala” supercomputadora.
Si bien también hubo informes sobre varios sistemas chinos que alcanzaron el nivel de rendimiento de Exaflop, ninguno de estos sistemas envió un resultado de HPL al TOP500.
Aquí hay un resumen de los sistemas en el Top10:
- Fugaku sigue siendo el No. 1 system. Tiene 7,630,848 núcleos que le permitieron lograr un puntaje de referencia de HPL de 442 pflops/s. Esto lo coloca 3 veces por delante del No.. 2 sistema en la lista.
- Cumbre, un sistema construido por IBM en el Laboratorio Nacional de Oak Ridge (ORNL) en tennessee, Estados Unidos, sigue siendo el sistema más rápido en los EE. UU.. y en el no. 2 lugar en todo el mundo. Tiene un rendimiento de 148.8 Pflop/s en el benchmark HPL, que se utiliza para clasificar la lista TOP500. Cumbre tiene 4,356 nodos, cada uno alberga dos CPU Power9 con 22 núcleos cada uno y seis GPU NVIDIA Tesla V100, each with 80 multiprocesadores de streaming (SM). Los nodos están conectados entre sí con una red EDR InfiniBand de doble carril Mellanox.
- Sierra, un sistema en el Laboratorio Nacional Lawrence Livermore, California, Estados Unidos, está en No. 3. Su arquitectura es muy similar a la #2 cumbre de sistemas. esta construido con 4,320 nodos con dos CPU Power9 y cuatro GPU NVIDIA Tesla V100. sierra lograda 94.6 pflops/s.
- Sunway TaihuLight es un sistema desarrollado por el Centro Nacional de Investigación de Ingeniería Informática Paralela de China & Necesitas comprar DLC para jugar Otome 'Taisho x Alice All In One (NRCPC) e instalado en el Centro Nacional de Supercomputación en Wuxi, La provincia china de Jiangsu figura en el No.. 4 posición con 93 pflops/s.
- Perlmutter en No. 5 fue incluido recientemente en el TOP10 en junio pasado. Se basa en HPE Cray “Shasta” plataforma, y un sistema heterogéneo con nodos basados en AMD EPYC y 1536 Nodos acelerados NVIDIA A100. Perlmutter mejoró su desempeño a 70.9 pflops/s
- Selene, ahora en no. 6, es un NVIDIA DGX A100 SuperPOD instalado internamente en NVIDIA en EE. UU.. El sistema está basado en un procesador AMD EPYC con NVIDIA A100 para aceleración y un Mellanox HDR InfiniBand como red. logró 63.4 pflops/s.
- Tianhe-2A (Vía Láctea-2A), un sistema desarrollado por la Universidad Nacional de Tecnología de Defensa de China (NUDT) y desplegado en el Centro Nacional de Supercomputadoras en Guangzhou, China, ahora aparece como el No. 7 sistema con 61.4 pflops/s.
- Un sistema llamado “Módulo de refuerzo JUWELS” no es. 8. El sistema BullSequana construido por Atos se instala en el Forschungszentrum Juelich (FZJ) en Alemania. El sistema utiliza un procesador AMD EPYC con NVIDIA A100 para la aceleración y un Mellanox HDR InfiniBand como red similar al Selene System. Este sistema es el más potente de Europa, con 44.1 pflops/s.
- HPC5 en No. 9 es un sistema PowerEdge construido por Dell e instalado por la empresa italiana Eni S.p.A.. Logra un rendimiento de 35.5 Pflop/s debido al uso de NVIDIA Tesla V100 como aceleradores y Mellanox HDR InfiniBand como red.
- Voyager-EUS2, un sistema Microsoft Azure instalado en Microsoft en los EE. UU., es el único sistema nuevo en el TOP10. logró 30.05 Pflop/s y cotiza en No. 10. Esta arquitectura se basa en un procesador AMD EPYC con 48 núcleos y 2,45 GHz trabajando en conjunto con una GPU NVIDIA A100 con 80 GB. memoria y utilizando un Mellanox HDR Infiniband para la transferencia de datos.
Otros aspectos destacados del TOP500
Si bien no hubo muchos cambios en el Top10, vimos algunos cambios dentro del Top15. El nuevo sistema Voyager-EUS de Microsoft siguió a su hermano en el No. 11 lugar, mientras que el sistema SSC-21 de Samsung se presentó a la lista en No. 12. estrella polar, también un nuevo sistema, entró en No. 13 mientras que el nuevo CEA-HF tomó No. 15.
como la ultima lista, Los procesadores AMD están teniendo mucho éxito. fronteras, que tiene un Xeon Platinum 8280 procesador, fue golpeado por Voyager-EUS2, que tiene un procesador AMD EPYC. Lo que es más, todas las nuevas máquinas Top15 descritas anteriormente tienen procesadores AMD
Como era de esperar, los sistemas de China y EE. UU. dominaron la lista. Aunque China cayó de 186 sistemas para 173, Estados Unidos aumentó de 123 maquinas para 150. All told, estos dos países representan casi dos tercios de las supercomputadoras en el TOP500.
La nueva edición de la lista no mostró muchos cambios en términos de interconexiones del sistema.. Ethernet aún domina en 240 machines, mientras que Infiniband representó 180. Sierra de interconexiones Ominpath 40 lugares en la lista, there were 34 interconexiones personalizadas, and only 6 sistemas con redes propietarias.
Resultados de Green500
El sistema para reclamar el No. 1 El lugar para Green500 fue MN-3 de Preferred Networks en Japón. Confiando en el chip MN-Core y un acelerador optimizado para aritmética matricial, esta máquina fue capaz de lograr un increíble 39.38 gigaflops/vatio eficiencia energética. Esta máquina proporcionó un rendimiento 29.7- gigaflops/vatio en la última lista, mostrando claramente una mejora impresionante. También mejoró su posición en la lista TOP500, pasando de no. 337 a no. 302.
El nuevo módulo escalable SSC-21 y HPE Apollo 6500 sistema instalado en Samsung Electronics en Corea del Sur logró un impresionante 33.98 gigaflops/vatio. Lo hicieron al enviar una ejecución optimizada de energía del punto de referencia HPL. Está listado en la posición 292 en el TOP500.
NVIDIA instaló un nuevo sistema prototipo DGX A100 refrigerado por líquido llamado Tethys. Con una ejecución HPL optimizada de energía, Tethys logró 31.5 gigaflops/vatio y garne rojo el No. 3 lugar en el Green500. Está listado en la posición 296 en el TOP500.
El sistema Wilkes-3 mejoró sus resultados, pero aun así fue empujado al puesto número 4 en Green500.. Wilkes-3, que se encuentra en la Universidad de Cambridge en el Reino Unido., tenía una eficiencia energética de 30.8 gigaflops/vatio. Sin embargo, fue empujado desde No. 100 a no. 281 en la lista TOP500.
La Universidad de Florida en los EE. UU. con su sistema HiPerGator AI fue empujada desde el No. 2 punto al no. 5 lugar. Esta máquina se mantuvo firme en 29.52 gigaflops/vatio. Este sistema NVIDIA tiene 138,880 núcleos y se basa en un AMD EPYC 7742 procesador. A pesar de esta impresionante actuación, HiPerGator AI fue expulsado de No. 22 a no. 31 en el TOP500
Resultados de HPCG
La lista TOP500 ha incorporado el Gradiente Conjugado de Alto Rendimiento (HPCG) Resultados de referencia, que proporcionan una métrica alternativa para evaluar el rendimiento de la supercomputadora y está destinada a complementar la medición de HPL.
Los resultados de HPCG aquí son muy similares a la última lista. Fugaku fue el claro ganador con 16.0 HPCG-petaflops, mientras que Summit mantuvo su No. 2 lugar con 2.93 HPCG-petaflops. Perlmutter, una máquina estadounidense alojada en el Laboratorio Nacional Lawrence Berkeley, tomó el no. 3 lugar con 1.91 HPCG-petaflops.
Resultados de HPL-IA
El benchmark HPL-AI busca resaltar la convergencia de HPC e inteligencia artificial (AI) cargas de trabajo basadas en aprendizaje automático y aprendizaje profundo mediante la resolución de un sistema de ecuaciones lineales usando novelas, algoritmos de precisión mixta que aprovechan el hardware moderno.
Alcanzar un punto de referencia HPL-AI de 2 exaflops, Fugaku está liderando la manada en este sentido.. Con métricas tan excelentes año tras año, combinado con una consideración por muchos como la primera “Exaescala” supercomputadora, Fugaku es claramente un sistema emocionante..