I modelli linguistici di grandi dimensioni come ChatGPT hanno rivoluzionato il campo dell'elaborazione del linguaggio naturale, ma continuano a lottare con alcuni compiti base come l'aritmetica e il controllo dei fatti. Se ad oggi esistono modelli di intelligenza artificiale in grado di eseguire ricerche sul Web autonomamente (come la recente Bing Chat), sono stati fino ad ora basati su grandi quantità di indicazioni umane o di impostazioni specifiche per eseguire task definiti.
La novità di Toolformer, modello AI-based presentato dai ricercatori Meta, sta nella abilità di auto-apprendere in maniera generica l'uso di strumenti esterni ad esso (come motori di ricerca, calendari, calcolatrici e quant'altro) senza dover passare da una formazione specializzata e senza compromettere le capacità di modellazione del linguaggio di base.
Toolformer si basa in particolare su un modello GPT-J preaddestrato con 6,7 miliardi di parametri contro i 175 miliardi di parametri su cui si basa GPT-3. Eppure dai test condotti dai ricercatori, sembra che Toolformer riesca ad esprimere prestazioni migliori proprio in virtù della possibilità di usare strumenti esterni.
Le API alla base dell’IA di Meta
Tutto ciò è reso possibile dalla capacità di utilizzare le API (Application Programming Interface): un insieme di protocolli che consentono a diverse applicazioni di comunicare tra loro, spesso in modo continuo e automatizzato.
I ricercatori Meta, durante l'allenamento di Toolformer, gli hanno fornito un piccolo gruppo di esempi scritti dall'essere umano a dimostrazione di come ciascuna API doveva essere utilizzata, consentendo successivamente all'IA di scrivere un set di dati di modellazione del linguaggiocon chiamate API.
Tramite la tecnica della formazione "auto-supervisionata", l'IA di Meta ha appreso senza che fosse necessario un essere umano che la guidasse.
Grazie a questo processo, l'IA ha imparato a interpretare ogni chiamata API basata su testo come fosse una qualsiasi altra forma di testo
Così può inserire le chiamate alle API quando è necessario, passare loro gli argomenti opportuni e, durante le "risposte" ad un essere umano, scegliere lo strumento più adatto al contesto e come utilizzarlo. Strumenti che possono essere traduttori, motori di ricerca, calcolatori, calendari e tutto quanto possa essere controllato tramite API.
Il futuro dopo Toolformer
Evidentemente, l'approccio seguito con Toolformer può portare ad un futuro in cui modelli di IA che utilizzano applicazioni esterne possono agire come assistenti personali versatili e trasformare il modo in cui l'uomo interagisce e si interfaccia con le macchine.
Date le maggiori potenzialità e capacità che comporta, inevitabilmente ci saranno anche maggiori rischi
La capacità di eseguire chiamate API potrebbe però anche aumentare la capacità di un modello di IA di causare danni ai dati dell'utente (nelle app) o creare problemi nel mondo esterno (tramite un browser Web o strumenti di comunicazione), capacità che potrebbero invocare accidentalmente mentre forniscono una risposta.