Miniaturizzare i supercomputer con un chip grande come un wafer

Un chip grande quanto un wafer consente di miniaturizzare i supercomputer e offre una nuova frontiera del calcolo per le intelligenze artificiali

mettiti alla prova con il quiz di mr. Plus su Fogli Google

LinkedIn X Facebook WhatsApp Email

Il mondo dell'informatica ci ha ormai abituati all'esigenza della miniaturizzazione: chip e dispositivi sempre più piccoli quanto potenti. Con l'avvento dei supercomputer lo spazio necessario alle grandi potenze di calcolo delle intelligenze artificiali è aumentato, ma ora c'è un'azienda che ha realizzato un chip grande quanto un wafer che consente di miniaturizzare queste potenti macchine.

La Cerebras si è specializzata nella progettazione e realizzazione dei chip più grandi al mondo, come il Cerebras Wafer-Scale Engine (WSE), lungo 8,5 pollici (poco meno di 22 cm) e che ospita 1200 miliardi di transistor, che sarebbe in grado di aiutare le intelligenze artificiali a svolgere super calcoli in appena pochi giorni rispetto ai mesi richiesti da un "classico" supercomputer. Il nuovo chip sfida quindi la GPU Nvidia A100, che nelle dimensioni di un pollice (2,54 cm) ospita 54 miliardi di transistor ed è l'attuale star del mondo del supercalcolo. Inoltre, si pone come tecnologia del futuro per lo sviluppo e la progettazione dei futuri supercomputer miniaturizzati in grado di far progredire l'intelligenza artificiale.

Perché produrre un grande chip?

mega chip Il chip WSE di Cerebras nasce con un obiettivo ben preciso: contribuire all'evoluzione del supercalcolo, accelerando la formazione dei modelli di deep learning dell'intelligenza artificiale. In appena un anno dal lancio, già diversi laboratori di supercalcolo lo stanno mettendo alla prova, in particolare il National Energy Technology Laboratory (NETL), che sta testando il chip per capirne le potenzialità oltre all'uso nell'AI (Artificial Intelligence).

Fastweb Mobile Full

10,95€/mese

Internet 200 GB e Minuti illimitati

Spedizione SIM GRATIS

scopri

I ricercatori del laboratorio statunitense NETL guidati da Dirk Van Essendelft e in collaborazione con Michael James di Cerebras hanno messo a confronto il chip WSE, alloggiato in un sistema all-in-one chiamato CS-1 e grande quanto un mini-frigo, e il supercomputer Joule 2.0 per lo svolgimento di una simulazione fluidodinamica. La simulazione del movimento dei fluidi comporta calcoli particolarmente complessi, ma è anche una delle attività più comuni svolte dai supercomputer, trovando applicazione, ad esempio, nelle previsioni meteorologiche o nella progettazione delle ali degli aerei.

I risultati del recente studio sono stati presentati alla conferenza SC20 di supercalcolo e hanno visto il chip grande quanto un wafer battere la tecnologia "tradizionale". Il CS-1 è riuscito a completare anche la simulazione della combustione in una centrale elettrica 200 volte più velocemente rispetto al supercomputer Joule 2.0, che è classificato come l'81° supercomputer più veloce al mondo.

A fare la differenza tra i due sistemi di calcolo non è solo la velocità di esecuzione di calcoli complessi, ma anche le prestazioni in termini di consumi energetici e dimensioni. Il supercomputer Joule occupa dozzine di rack di server, consuma fino a 450 kilowatt di potenza ed è costato decine di milioni di dollari. Il CS-1 di Cerebras invece occupa un terzo di un server rack, consuma 20 kilowatt di potenza ed è costato pochi milioni di dollari.

Chip WSE: il segreto è nel design

mega chip Nel campo della microelettronica, un wafer è una sottile fetta di materiale semiconduttore su cui vengono incisi i circuiti integrati che andranno a realizzare i chip. Solitamente, si tratta di un wafer di silicio che poi verrà tagliato in più pezzi dando vita ai chip individuali. Nel caso del WSE, il wafer viene lasciato intero, come se fosse una singola unità operativa che contiene quasi 400.000 core di elaborazione, ognuno dei quali è connesso alla propria memoria dedicata e ai quattro core adiacenti.

Proprio questo design è il segreto del funzionamento del chip di Cerebras. Quando si esegue un'elaborazione su larga scala, l'attività viene distribuita tra centinaia o migliaia di chip che operano in parallelo, lavorando in comunicazione costante e spostando le informazioni avanti e indietro tra i core del processore, che sta eseguendo i calcoli, e la memoria condivisa, per salvare i risultati ottenuti.

Immaginiamo di avere una grande azienda dislocata in più filiali nella città e con gli archivi che si trovano in sedi diverse da quella dell'elaborazione dei documenti. Le informazioni tra le filiali saranno scambiate attraverso l'uso di corrieri, che anche ottimizzando i percorsi tra un edificio e l'altro, dovranno comunque effettuare un viaggio che richiede un determinato minimo di tempo che, sommato a distanza e traffico, rallenta lo scambio dei documenti cartacei. Se la stessa azienda si spostasse in un grattacielo, dove sono riunite tutte le filiali, e ogni dipendente avesse un suo schedario in ufficio dove archiviare i documenti, anche dovendo accedere a quelli di un collega a un piano diverso (e quindi ad una diversa filiale) potrebbe farlo molto più rapidamente: basterebbe prendere l'ascensore.

Il chip di Cerebras funziona proprio come il grattacielo: il design gli permette di trasportare le informazioni in modo molto più efficiente e di elaborarle più velocemente rispetto a un supercomputer che si basa su una rete composta da tantissimi chip tradizionali che operano distanziati tra loro.

Limiti e potenzialità del WSE

mega chip4 Nonostante la sua velocità sia superiore rispetto a un supercomputer, il mega chip di Cerebras ha anche dei limiti. Il WSE può gestire solo problemi che siano abbastanza "piccoli" da essere supportati dal wafer, ma la sua capacità di gestirli praticamente in tempo reale ha una enorme potenzialità. Si pensi, ad esempio, alla simulazione accurata del flusso d'aria intorno a un elicottero che cerca di atterrare su una pista. Utilizzando il mega-chip sarebbe possibile semi-automatizzare il processo con una elaborazione in tempo reale, un'applicazione impensabile ad oggi da eseguire con i tradizionali chip.

Tra le altre applicazioni, sicuramente spiccano quelle legate al deep learning e all'addestramento delle reti neurali. Il chip consente infatti di velocizzare il machine learning delle intelligenze artificiali e questo è solo l'inizio. L'azienda sta già lavorando a un chip di nuova generazione dotato di 2.6 trilioni di transistor, 850.000 core e oltre il doppio della memoria. Cerebras punta ad affermarsi nel campo dei chip dei supercomputer del futuro, trovando il suo posto tra i chip neuromorfici basati su memristori che imitano il cervello umano e ancora i computer quantistici. Tre tecnologie diverse che potrebbero lottare tra loro per affermarsi, o trovare il modo di unirsi per la progettazione e realizzazione di computer sempre più potenti.

A cura di Cultur-e

#CuriositaTech

#DigitalDevelopment

Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.

Fda

L'IA nel mondo del lavoro

L'IA nel mondo del lavoro

Impatti, sfide e opportunità

Iscriviti al corso gratuito

LinkedIn X Facebook WhatsApp Email

Boom di brani AI su Deezer, ma l'algoritmo limita la visibilità

Secondo fonti interne ogni giorno gli utenti caricano circa 20.000 brani realizzati esclusivamente con strumenti di intelligenza artificiale generativa

Digital Magazine

Google lancia l'AI che capisce i delfini, cosa può fare DolphinGemma

Il modello linguistico AI sviluppato da Google permette ai ricercatori di scomporre i suoni emessi dai delfini in token da utilizzare in ottica previsionale.

Digital Magazine

Da chatbot ad amico AI, cosa succede quando la relazione diventa umana

L’AI fa ormai parte della vita degli utenti, che vi si confrontano ogni giorno: cosa succede quando si instaura una relazione AI e i chatbot diventano amici

Scopri i corsi gratuiti della Fastweb Digital Academy

A. I. copywriting – Come usare l’intelligenza artificiale per creare contenuti

L’intelligenza artificiale sta facendo passi da gigante in tutti i campi: dalla gestione e interpretazione dei big data ai chatbot e virtual…

AI nel processo creativo del designer

AI nel processo creativo del designer offre una panoramica sull’applicazione dell’intelligenza artificiale nel campo del design. Questo video on…

AI per le moodboard: identità e colore

AI per le moodboard: identità e colore ci guida alla scoperta di come l’intelligenza artificiale possa diventare un prezioso alleato per i creativi,…