Il deep learning è una componente alla base di praticamente tutta l’intelligenza artificiale con cui le persone stanno imparando a interagire in questo momento storico.
Da ChatGPT a DALL-E, da Copilot a Midjourney: i principali tool AI sono stati addestrati con algoritmi di deep learning, grazie a cui riescono a comprendere gli input testuali dell’essere umano, ma anche a riconoscere immagini o altri contenuti multimediali.
Detto questo esistono tantissime altre applicazioni del deep learning, che tirano in ballo i contesti e i settori più disparati: dalla sanità alle operations, dall’antifrode al customer care.
Cosa vuol dire deep learning
Shutterstock
Il termine “deep learning” (apprendimento profondo) viene utilizzato per fare riferimento a classi di algoritmi di apprendimento automatico, contraddistinti da caratteristiche ben specifiche.
Ad esempio gli algoritmi di deep learning, che siano di tipo supervisionato o non supervisionato, ricorrono a livelli di unità non lineari a cascata. Ciò vuol dire che il livello parte dall’input fornito dal livello precedente.
Inoltre gli algoritmi di deep learning si basano su una particolare tipologia di apprendimento delle caratteristiche, delle rappresentazioni dei dati e dei livelli gerarchici.
Infine gli algoritmi di deep learning creano diverse gerarchie di concetti, a partire da livelli multipli sia in termini di rappresentazione che di astrazione.
Breve storia del deep learning
Shutterstock
In questo momento storico il grandissimo successo di strumenti di intelligenza artificiale e intelligenza artificiale generativa sta facendo conoscere il deep learning anche al grande pubblico.
Più in generale, il deep learning è spesso e volentieri legato a doppia mandata al concetto di rete neurale: un modello computazionale che si ispira alla rete neurale dell’essere umano.
I primi esperimenti relativi all’apprendimento profondo e le reti neurali risalgono a circa 50 anni fa. Nel 1975 infatti lo scienziato giapponese Kunihiko Fukushima era tra i primi a introdurre l’idea di area di connessione tra i neuroni, dando un contributo decisivo ai primi studi sulle reti neurali multistrato.
I primi esperimenti sull'apprendimento profondo, che hanno dato vita ai primi studi sulle reti neurali, sono stati eseguiti circa 50 anni fa
Purtroppo ai tempi di Fukushima non esistevano elaboratori con una capacità computazionale in grado di gestire la quantità di dati necessaria per la creazione e l’addestramento delle reti neurali. E probabilmente non esisteva nemmeno una quantità di dati sufficiente alla creazione di metodi di addestramento soddisfacenti.
Il progresso tecnologico e la crescente disponibilità di dati hanno rappresentato la chiave di volta perché le reti neurali, da concetto teorico, si trasformassero in realtà.
Quali sono le architetture e i modelli di deep learning
Shutterstock
Il funzionamento del deep learning non può essere spiegato con una definizione univoca. Molto infatti dipende dal tipo di architettura o di modello in cui viene applicato.
Quando si parla di deep learning e architetture, ci si collega innanzitutto alle sopracitate reti neurali: ad esempio le reti neurali convoluzionali, o le reti neurali ricorsive.
Le reti neurali convoluzionali sono una conseguenza diretta dei primi studi di Kunihiko Fukushima e vengono utilizzate soprattutto nell’ambito dell’elaborazione di dati visuali e di tipo 2D.
Si tratta di reti neurali più semplici da allenare rispetto ad altre, soprattutto per via del minor numero di parametri da stimare. DeepDream, il programma di elaborazione di immagini Google, utilizza una rete neurale convoluzionale.
Le reti neurali ricorsive sono reti deterministiche: ciò vuol dire che la medesima sequenza di input determina sempre e comunque un’unica sequenza di output.
Allo stesso tempo non possono creare collegamenti tra input diversi, considerato che pesano il singolo input in base allo stato precedente.
Detto ciò, esistono tante altre tipologie di reti neurali a cui vengono applicati algoritmi di deep learning: dalle reti neurali profonde a quelle di impilamento profondo o di impilamento profondo di tensore.
Allo stesso modo esistono modo il deep learning è alla base di o si integra con modelli e strumenti di altra natura. È il caso ad esempio dell’hashing semantico, ma anche di determinati software di diagnostica.
Quali sono le applicazioni del deep learning
Shutterstock
Oggi gli algoritmi di deep learning vengono utilizzati per addestrare tanti diversi strumenti di intelligenza artificiale e intelligenza artificiale generativa.
Le applicazioni del deep learning intersecano dunque le funzionalità e i servizi legati ai principali tool AI disponibili sul mercato: a partire dall’elaborazione del linguaggio naturale, fino ad arrivare al riconoscimento delle immagini.
Nel caso dell’elaborazione del linguaggio naturale, il deep learning addestra l’AI alla comprensione di un contenuto: ad esempio il testo di un documento, piuttosto che le parole pronunciate da una voce umana.
Anche se, in effetti, la comprensione e l’elaborazione del linguaggio da parte dell’AI sono molto diverse rispetto a quanto non si potrebbe pensare.
Il deep learning è strettamente legato alle intelligenze artificiali generative, ma anche ad applicazioni e settori diversi
I contenuti infatti vengono tendenzialmente frammentati in token: delle unità di base, composte anche da pochi caratteri, che vanno poi ad alimentare un modello previsionale.
Nel caso del riconoscimento delle immagini, l’addestramento dell’AI porta invece a una comprensione molto più simile a quella umana.
Anche se poi le intelligenze artificiali sono chiamate a trasformare il segnale analogico in un corrispondente digitale, che verrà poi memorizzato sotto forma di matrice numerica.
Il deep learning però va ben oltre ChatGPT, DALL-E o simili. L’apprendimento profondo gioca un ruolo fondamentale anche nei sistemi di guida autonoma sempre più avanzati delle smart car.
Allo stesso modo può essere utilizzato in tantissimi altri settori: dalla bioinformatica alla tossicologia, passando per l’identificazione delle frodi, la gestione di operazioni e processi aziendali e addirittura il rapporto tra medico e paziente.
Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi