La instrucción AMD WMMA es una respuesta directa a NVIDIA Tensor Cores -

[ad_1]

La IP de gráficos RDNA3 de AMD está a la vuelta de la esquina, y estamos escuchando más información sobre la próxima arquitectura. Históricamente, a medida que avanzan las GPU, no es inusual que las empresas agreguen bloques de hardware dedicados para acelerar una tarea específica. Hoy, Los ingenieros de AMD han actualizado el backend del compilador LLVM para incluir una nueva instrucción llamada Wave Matrix Multiply-Accumulate (WMMA). Esta instrucción estará presente en GFX11, cual es la arquitectura GPU RDNA3. Con WMMA, AMD ofrecerá soporte para procesar tensores de tamaño 16x16x16 en formatos de precisión FP16 y BF16. Con estas instrucciones, AMD está agregando nuevos arreglos para admitir el procesamiento de operaciones de matriz de multiplicación y acumulación. Esto imita de cerca el trabajo que NVIDIA está haciendo con Tensor Cores.

AMD ROCm 5.2 La actualización de API enumera el caso de uso para este tipo de instrucción, que puedes ver a continuación:

rocWMMA proporciona una API de C++ para facilitar la descomposición de la matriz, la multiplicación de los problemas acumulados en fragmentos y su uso en operaciones por bloques que se distribuyen en paralelo a través de los frentes de onda de la GPU.. La API es una biblioteca de encabezado de código de dispositivo GPU, lo que significa que la aceleración del núcleo de la matriz se puede compilar directamente en el código de su dispositivo kernel. Esto puede beneficiarse de la optimización del compilador en la generación del ensamblaje del kernel y no genera costos generales adicionales de vinculación a bibliotecas de tiempo de ejecución externas o tener que lanzar kernels separados..

rocWMMA se lanza como una biblioteca de encabezados e incluye proyectos de prueba y muestra para validar e ilustrar usos de ejemplo de la API de C++. La multiplicación de la matriz GEMM se usa como validación principal dado el fuerte precedente para la biblioteca. Sin embargo, la cartera de uso está creciendo significativamente y demuestra diferentes formas en que se puede consumir rocWMMA.

[ad_2]

Noticias

50+ enhanced games available at launch November 7 - PlayStation.Blog

As the Persona and Yakuza series fly beyond 20 million sales each, Sega says its JRPG successes are thanks to the power of multi-platform releases

“Venus Vacation PRISM – DEAD OR ALIVE Xtreme -” Coming March 6th, 2025 & Available for Pre-order – PlayStation.Blog

Selecciones de Nintendo Life eShop & Lectores’ Elección (Octubre 2024)

Monster Hunter Wilds players keep making Final Fantasy 14’s Yoshi-P in the beta character creator, and he’s not totally happy about it

Final Fantasy 14’s Yoshi-P confirms Square Enix remains committed to its multiplatform strategy, but hopes more Xbox fans actually play its new JRPGs

ICYMI: 'Música de Nintendo’ Has Spoiler Prevention, Here’s How To Activate It

Diablo 4 jefe’ plan for Gears of War 6 would’ve taken the series to space, pero “we weren’t going to start Mass Effect-ing this”

Pelea de arte de caja – Duelo: Generaciones Sonic X Shadow

La instrucción AMD WMMA es una respuesta directa a NVIDIA Tensor Cores