Il mondo dell'informatica ci ha ormai abituati all'esigenza della miniaturizzazione: chip e dispositivi sempre più piccoli quanto potenti. Con l'avvento dei supercomputer lo spazio necessario alle grandi potenze di calcolo delle intelligenze artificiali è aumentato, ma ora c'è un'azienda che ha realizzato un chip grande quanto un wafer che consente di miniaturizzare queste potenti macchine.
La Cerebras si è specializzata nella progettazione e realizzazione dei chip più grandi al mondo, come il Cerebras Wafer-Scale Engine (WSE), lungo 8,5 pollici (poco meno di 22 cm) e che ospita 1200 miliardi di transistor, che sarebbe in grado di aiutare le intelligenze artificiali a svolgere super calcoli in appena pochi giorni rispetto ai mesi richiesti da un "classico" supercomputer. Il nuovo chip sfida quindi la GPU Nvidia A100, che nelle dimensioni di un pollice (2,54 cm) ospita 54 miliardi di transistor ed è l'attuale star del mondo del supercalcolo. Inoltre, si pone come tecnologia del futuro per lo sviluppo e la progettazione dei futuri supercomputer miniaturizzati in grado di far progredire l'intelligenza artificiale.
Perché produrre un grande chip?
Il chip WSE di Cerebras nasce con un obiettivo ben preciso: contribuire all'evoluzione del supercalcolo, accelerando la formazione dei modelli di deep learning dell'intelligenza artificiale. In appena un anno dal lancio, già diversi laboratori di supercalcolo lo stanno mettendo alla prova, in particolare il National Energy Technology Laboratory (NETL), che sta testando il chip per capirne le potenzialità oltre all'uso nell'AI (Artificial Intelligence).
I ricercatori del laboratorio statunitense NETL guidati da Dirk Van Essendelft e in collaborazione con Michael James di Cerebras hanno messo a confronto il chip WSE, alloggiato in un sistema all-in-one chiamato CS-1 e grande quanto un mini-frigo, e il supercomputer Joule 2.0 per lo svolgimento di una simulazione fluidodinamica. La simulazione del movimento dei fluidi comporta calcoli particolarmente complessi, ma è anche una delle attività più comuni svolte dai supercomputer, trovando applicazione, ad esempio, nelle previsioni meteorologiche o nella progettazione delle ali degli aerei.
I risultati del recente studio sono stati presentati alla conferenza SC20 di supercalcolo e hanno visto il chip grande quanto un wafer battere la tecnologia "tradizionale". Il CS-1 è riuscito a completare anche la simulazione della combustione in una centrale elettrica 200 volte più velocemente rispetto al supercomputer Joule 2.0, che è classificato come l'81° supercomputer più veloce al mondo.
A fare la differenza tra i due sistemi di calcolo non è solo la velocità di esecuzione di calcoli complessi, ma anche le prestazioni in termini di consumi energetici e dimensioni. Il supercomputer Joule occupa dozzine di rack di server, consuma fino a 450 kilowatt di potenza ed è costato decine di milioni di dollari. Il CS-1 di Cerebras invece occupa un terzo di un server rack, consuma 20 kilowatt di potenza ed è costato pochi milioni di dollari.
Chip WSE: il segreto è nel design
Nel campo della microelettronica, un wafer è una sottile fetta di materiale semiconduttore su cui vengono incisi i circuiti integrati che andranno a realizzare i chip. Solitamente, si tratta di un wafer di silicio che poi verrà tagliato in più pezzi dando vita ai chip individuali. Nel caso del WSE, il wafer viene lasciato intero, come se fosse una singola unità operativa che contiene quasi 400.000 core di elaborazione, ognuno dei quali è connesso alla propria memoria dedicata e ai quattro core adiacenti.
Proprio questo design è il segreto del funzionamento del chip di Cerebras. Quando si esegue un'elaborazione su larga scala, l'attività viene distribuita tra centinaia o migliaia di chip che operano in parallelo, lavorando in comunicazione costante e spostando le informazioni avanti e indietro tra i core del processore, che sta eseguendo i calcoli, e la memoria condivisa, per salvare i risultati ottenuti.
Immaginiamo di avere una grande azienda dislocata in più filiali nella città e con gli archivi che si trovano in sedi diverse da quella dell'elaborazione dei documenti. Le informazioni tra le filiali saranno scambiate attraverso l'uso di corrieri, che anche ottimizzando i percorsi tra un edificio e l'altro, dovranno comunque effettuare un viaggio che richiede un determinato minimo di tempo che, sommato a distanza e traffico, rallenta lo scambio dei documenti cartacei. Se la stessa azienda si spostasse in un grattacielo, dove sono riunite tutte le filiali, e ogni dipendente avesse un suo schedario in ufficio dove archiviare i documenti, anche dovendo accedere a quelli di un collega a un piano diverso (e quindi ad una diversa filiale) potrebbe farlo molto più rapidamente: basterebbe prendere l'ascensore.
Il chip di Cerebras funziona proprio come il grattacielo: il design gli permette di trasportare le informazioni in modo molto più efficiente e di elaborarle più velocemente rispetto a un supercomputer che si basa su una rete composta da tantissimi chip tradizionali che operano distanziati tra loro.
Limiti e potenzialità del WSE
Nonostante la sua velocità sia superiore rispetto a un supercomputer, il mega chip di Cerebras ha anche dei limiti. Il WSE può gestire solo problemi che siano abbastanza "piccoli" da essere supportati dal wafer, ma la sua capacità di gestirli praticamente in tempo reale ha una enorme potenzialità. Si pensi, ad esempio, alla simulazione accurata del flusso d'aria intorno a un elicottero che cerca di atterrare su una pista. Utilizzando il mega-chip sarebbe possibile semi-automatizzare il processo con una elaborazione in tempo reale, un'applicazione impensabile ad oggi da eseguire con i tradizionali chip.
Tra le altre applicazioni, sicuramente spiccano quelle legate al deep learning e all'addestramento delle reti neurali. Il chip consente infatti di velocizzare il machine learning delle intelligenze artificiali e questo è solo l'inizio. L'azienda sta già lavorando a un chip di nuova generazione dotato di 2.6 trilioni di transistor, 850.000 core e oltre il doppio della memoria. Cerebras punta ad affermarsi nel campo dei chip dei supercomputer del futuro, trovando il suo posto tra i chip neuromorfici basati su memristori che imitano il cervello umano e ancora i computer quantistici. Tre tecnologie diverse che potrebbero lottare tra loro per affermarsi, o trovare il modo di unirsi per la progettazione e realizzazione di computer sempre più potenti.