login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Come funziona la nuova tecnica con cui il MIT addestra i robot multiuso

Ascolta l'articolo

Ispirati dai Large Language Models, gli scienziati del Massachusetts Institute of Technology potrebbero rivoluzionare l’addestramento dei robot a più compiti

robot ai Shutterstock

Nuove tecniche di addestramento in via di sviluppo potrebbero portare allo sviluppo più rapido dei cosiddetti robot multiuso. In questo momento storico la realizzazione dei robot viene generalmente circoscritta ad ambiti e obiettivi specifici. 

Tale approccio permette di ridurre la quantità di dati e informazioni durante l’addestramento, ma anche di costruire esclusivamente le componenti necessarie per l’esecuzione di compiti mirati. 

Il modus operandi attuale potrebbe però venire rivoluzionato, o per lo meno ampliato, dai ricercatori del Massachusetts Institute of Technology (MIT), che hanno sviluppato una nuova tecnica per addestrare un robot a vaste gamme di compiti eterogenei. 

Il segreto della tecnica sviluppata dal MIT consiste nell’utilizzare e poi allineare dati provenienti da domini diversi, in modo da non dover riaddestrare da zero il robot ogni qual volta diventi necessario formarlo all’esecuzione di un nuovo compito. 

Come stanno venendo addestrati i nuovi robot multiuso del MIT

L’addestramento “classico” dei robot si fonda spesso sull’osservazione di un comportamento da replicare e, per raggiungere questo obiettivo, parte da dispositivi e sensori specifici: dalle telecamere ai sistemi di misurazione e valutazione propriocettiva. 

Il limite di questo metodo spesso è legato alla scarsa quantità di dati a disposizione del robot, che finisce per non riuscire ad eseguire il compito richiesto non appena cambiano alcuni parametri chiave, come ad esempio quelli relativi all’ambiente circostante. 

La soluzione proposta dal MIT trae ispirazione dai Large Language Models utilizzati per la realizzazione dei sistemi di intelligenza artificiale generativa. La logica di addestramento dei modelli prevede innanzitutto l’utilizzo di una grandissima quantità di dati che vengono utilizzati per una specie di formazione di base.

A ciò seguono ulteriori addestramenti che richiedono quantità sensibilmente inferiori di informazione e che mirano ad espandere le funzionalità del modello: ad esempio con la possibilità di comprendere nuovi argomenti, ma anche con la capacità di adattarsi a variabili differenti. 

La sfida del MIT è stata traslare questo modello che prevede esclusivamente informazioni di tipo testuale per portarlo nel perimetro dei robot, che invece hanno bisogno di dati eterogenei

Il risultato dei loro studi è un nuovo tipo di architettura di nome Heterogeneus Pretrained Transformers, o HPT, che sembra poter semplificare soprattutto l’apprendimento e l’esecuzione dei cosiddetti movimenti agili

Cosa possono fare i robot multiuso

L’HPT messo a punto dal MIT partendo dai Large Language Models è stato testato innanzitutto per la creazione di decine di set di dati utili al pre-addestramento generico di robot pensati per funzioni diverse, contenenti oltre 200.000 traiettorie robotiche divise in categorie specifiche. 

I Tech-Quiz di Mister Plus

0/ 0
Risposte corrette
0' 0"
Tempo impiegato
Vai alla classifica

In questo modo i robot sono in grado di riconoscere determinati token presenti nell’architettura di dati, che utilizzano come elemento di partenza anche in ottica di addestramenti futuri

Il risultato è una riduzione dei tempi di addestramento nel caso dei movimenti agili, ma anche un miglioramento complessivo delle prestazioni in più del 20% delle simulazioni analizzate. 

Ma le sfide non finiscono qui. Ora il MIT punta allo sviluppo di un “cervello robotico universale”: un sistema di addestramento pronto per essere installato in robot totalmente privi di formazione antecedente. 

A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
Fda
Prompt engineering
Immagine principale del blocco
Prompt engineering
Fda gratis svg
Come interrogare le intelligenze artificiali
Iscriviti al corso gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.