login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Toolformer, l'IA di Meta che sfrutta i modelli di GPT

Ascolta l'articolo

Svelato un modello di linguaggio capace di auto-apprendere l'utilizzo di API per interfacciarsi con strumenti esterni: come funziona

intelligenza Artificiale Shutterstock

I modelli linguistici di grandi dimensioni come ChatGPT hanno rivoluzionato il campo dell'elaborazione del linguaggio naturale, ma continuano a lottare con alcuni compiti base come l'aritmetica e il controllo dei fatti. Se ad oggi esistono modelli di intelligenza artificiale in grado di eseguire ricerche sul Web autonomamente (come la recente Bing Chat), sono stati fino ad ora basati su grandi quantità di indicazioni umane o di impostazioni specifiche per eseguire task definiti.

La novità di Toolformer, modello AI-based presentato dai ricercatori Meta, sta nella abilità di auto-apprendere in maniera generica l'uso di strumenti esterni ad esso (come motori di ricerca, calendari, calcolatrici e quant'altro) senza dover passare da una formazione specializzata e senza compromettere le capacità di modellazione del linguaggio di base.

Toolformer si basa in particolare su un modello GPT-J preaddestrato con 6,7 miliardi di parametri contro i 175 miliardi di parametri su cui si basa GPT-3. Eppure dai test condotti dai ricercatori, sembra che Toolformer riesca ad esprimere prestazioni migliori proprio in virtù della possibilità di usare strumenti esterni.

Le API alla base dell’IA di Meta

Tutto ciò è reso possibile dalla capacità di utilizzare le API (Application Programming Interface): un insieme di protocolli che consentono a diverse applicazioni di comunicare tra loro, spesso in modo continuo e automatizzato. 

I ricercatori Meta, durante l'allenamento di Toolformer, gli hanno fornito un piccolo gruppo di esempi scritti dall'essere umano a dimostrazione di come ciascuna API doveva essere utilizzata, consentendo successivamente all'IA di scrivere un set di dati di modellazione del linguaggiocon chiamate API

Tramite la tecnica della formazione "auto-supervisionata", l'IA di Meta ha appreso senza che fosse necessario un essere umano che la guidasse.

Grazie a questo processo, l'IA ha imparato a interpretare ogni chiamata API basata su testo come fosse una qualsiasi altra forma di testo

Così può inserire le chiamate alle API quando è necessario, passare loro gli argomenti opportuni e, durante le "risposte" ad un essere umano, scegliere lo strumento più adatto al contesto e come utilizzarlo. Strumenti che possono essere traduttori, motori di ricerca, calcolatori, calendari e tutto quanto possa essere controllato tramite API.

Il futuro dopo Toolformer

Evidentemente, l'approccio seguito con Toolformer può portare ad un futuro in cui modelli di IA che utilizzano applicazioni esterne possono agire come assistenti personali versatili e trasformare il modo in cui l'uomo interagisce e si interfaccia con le macchine. 

Date le maggiori potenzialità e capacità che comporta, inevitabilmente ci saranno anche maggiori rischi

La capacità di eseguire chiamate API potrebbe però anche aumentare la capacità di un modello di IA di causare danni ai dati dell'utente (nelle app) o creare problemi nel mondo esterno (tramite un browser Web o strumenti di comunicazione), capacità che potrebbero invocare accidentalmente mentre forniscono una risposta.

A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
Fda
Prompt engineering
Immagine principale del blocco
Prompt engineering
Fda gratis svg
Come interrogare le intelligenze artificiali
Iscriviti al corso gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.