Xilinx lancia Alveo U55C, La sua carta acceleratore più potente di sempre
Creato appositamente per i carichi di lavoro HPC e Big Data, la nuova scheda Alveo U55C è la scheda acceleratore Alveo più potente di sempre dell'azienda, offrendo la più alta densità di calcolo e capacità HBM nel portafoglio di acceleratori Alveo. Insieme alla nuova soluzione di clustering basata su Xilinx RoCE v2, un ampio spettro di clienti con carichi di lavoro di elaborazione su larga scala può ora implementare un potente clustering HPC basato su FPGA utilizzando l'infrastruttura e la rete del data center esistente.
“Scalare le capacità di calcolo di Alveo per indirizzare i carichi di lavoro HPC è ora più semplice, più efficiente e più potente che mai,” disse Salil Raje, vicepresidente esecutivo e direttore generale, Data Center Group a Xilinx. “Architettonicamente, Gli acceleratori basati su FPGA come le schede Alveo offrono le massime prestazioni al minor costo per molti carichi di lavoro ad alta intensità di calcolo. Introducendo una metodologia basata su standard che consente la creazione di cluster Alveo HPC utilizzando l'infrastruttura e la rete esistenti del cliente, stiamo offrendo questi vantaggi chiave su vasta scala a qualsiasi data center. Si tratta di un importante passo avanti per un'adozione ancora più ampia di Alveo e dell'Adaptive Computing in tutto il data center.”
Creato per applicazioni HPC e big data
La scheda Alveo U55C combina molte caratteristiche chiave richieste dai carichi di lavoro HPC odierni. Offre più parallelismo delle pipeline di dati, gestione della memoria superiore, spostamento dei dati ottimizzato in tutta la pipeline, e il più alto rendimento per watt nel portafoglio Alveo. La scheda Alveo U55C è un'intera altezza a slot singolo, mezza lunghezza (FHHL) fattore di forma con un basso 150 W potenza massima. Offre una densità di elaborazione superiore e raddoppia l'HBM2 in 16 GB rispetto al suo predecessore, la scheda Alveo U280 a doppio slot. L'U55C offre più capacità di calcolo in un fattore di forma più piccolo per la creazione di densi cluster basati su acceleratori Alveo. È progettato per lo streaming di dati ad alta densità, matematica ad alto IO, e grandi problemi di elaborazione che richiedono la scalabilità orizzontale come l'analisi dei big data e le applicazioni di intelligenza artificiale.
Sfruttare RoCE v2 e il bridging del data center, accoppiato con 200 Larghezza di banda Gbps, la soluzione di clustering basata su API abilita una rete Alveo che compete con le reti InfiniBand in termini di prestazioni e latenza, senza vincoli al fornitore. L'integrazione MPI consente agli sviluppatori HPC di scalare il pipelining di dati Alveo dalla piattaforma software unificata Xilinx Vitis. Utilizzo di standard e framework aperti esistenti, ora è possibile scalare su centinaia di schede Alveo indipendentemente dalle piattaforme server e dall'infrastruttura di rete e con carichi di lavoro e memoria condivisi.
Gli sviluppatori di software e i data scientist possono sbloccare i vantaggi di Alveo e dell'Adaptive Computing attraverso la programmabilità di alto livello sia dell'applicazione che del cluster utilizzando la piattaforma Vitis?. Xilinx ha investito molto nella piattaforma di sviluppo Vitis e nel flusso di strumenti per rendere l'elaborazione adattiva più accessibile agli sviluppatori di software e ai data scientist senza competenze hardware. Sono supportati i principali framework AI come Pytorch e Tensorflow, così come linguaggi di programmazione di alto livello come C, C++ e Python, consentendo agli sviluppatori di creare soluzioni di dominio utilizzando API e librerie specifiche, o utilizzare i kit di sviluppo software Xilinx, per accelerare facilmente i carichi di lavoro HPC chiave all'interno di un data center esistente.
Casi d'uso dei clienti HPC
CSIRO, L'organizzazione di ricerca nazionale australiana insieme alla più grande schiera di antenne per radioastronomia al mondo, utilizza le schede Alveo U55C per l'elaborazione del segnale nel radiotelescopio Square Kilometer Array. L'implementazione delle schede Alveo come acceleratori collegati alla rete con HBM consente un enorme throughput su larga scala attraverso il cluster di elaborazione del segnale HPC. Il cluster basato sull'acceleratore Alveo consente a CSIRO di affrontare l'enorme compito di calcolo dell'aggregazione, filtraggio, preparazione ed elaborazione dei dati da 131,000 antenne in tempo reale. Gli 460 Gbps di larghezza di banda HBM2 attraverso il cluster di elaborazione del segnale sono serviti da 420 Schede Alveo U55C completamente collegate in rete su P4-abilitate 100 Switch Gbps. Il cluster Alveo U55C offre prestazioni di elaborazione con un throughput complessivo di 15 Tb/s in una potenza compatta e un ingombro ridotto. CSIRO sta ora completando un progetto di riferimento Alveo di esempio per aiutare altre radioastronomia o industrie adiacenti a raggiungere lo stesso successo.
Il software di simulazione di incidenti Ansys LS-DYNA è utilizzato da quasi tutte le aziende automobilistiche del mondo. La progettazione di sistemi strutturali e di sicurezza dipende dalle prestazioni dei modelli in quanto mitigano i costi dei crash test fisici con il metodo degli elementi finiti di progettazione assistita da computer (CINQUE) simulazioni. I risolutori FEM sono gli algoritmi principali che guidano simulazioni con centinaia di milioni di gradi di libertà, questi enormi algoritmi possono essere suddivisi in solutori più rudimentali come PCG, matrici sparse e ICCG. Ridimensionando molte schede Alveo con il pipelining di dati iperparallelo, LS-DYNA può accelerare le prestazioni di oltre 5 volte rispetto alle CPU x86. Ciò si traduce in più lavoro per ciclo di clock in una pipeline Alveo con i clienti LS-DYNA che beneficiano di tempi di simulazione rivoluzionari.
“Nello spirito dell'innovazione incessante, siamo entusiasti di collaborare con Xilinx per accelerare significativamente i risolutori agli elementi finiti, che può rappresentare 90% del carico di lavoro di calcolo per la meccanica implicita, nella nostra applicazione di simulazione LS-DYNA,” disse Wim Slagter, direttore delle partnership strategiche presso Ansys. “Non vediamo l'ora che l'accelerazione di Xilinx ci aiuti nella nostra missione di supportare gli innovatori nell'ingegneria del futuro.”
TigerGraph, fornitore di una piattaforma leader di analisi dei grafici, utilizza più schede Alveo U55C per raggruppare e accelerare i due algoritmi più prolifici che guidano i motori di raccomandazione e clustering basati su grafici. I database grafici sono una piattaforma dirompente per i data scientist. I grafici prendono i dati dai silos e focalizzano l'attenzione sulle relazioni tra i dati. La prossima frontiera per il grafico è trovare quelle risposte in tempo reale. Alveo U55C accelera i tempi di query e le previsioni per i motori di raccomandazione da minuti fino a millisecondi. Utilizzando più schede U55C per aumentare l'analisi, la potenza di calcolo superiore e la larghezza di banda della memoria accelerano le velocità di query del grafico fino a 45 volte più velocemente rispetto ai cluster basati su CPU. La qualità dei punteggi aumenta anche fino a 35%, con conseguente maggiore sicurezza riducendo drasticamente i falsi positivi a cifre singole basse.
Disponibilità del prodotto e valutazioni facili
La scheda Alveo U55C è attualmente disponibile su Xilinx.com e tramite i distributori autorizzati Xilinx. È anche disponibile per una facile valutazione tramite provider FPGA-as-a-Service basati su cloud pubblico, così come selezionare data center di colocation per anteprime private. Il clustering è ora disponibile per le anteprime private, con disponibilità generale prevista nel secondo trimestre del prossimo anno.
Xilinx presenta la scheda acceleratore Alveo U55C, insieme alle soluzioni dei partner, alla conferenza SC21 che si terrà questa settimana. Registrati a SC21 per visitare lo stand virtuale di Xilinx.