OpenAI, piattaforma per l'intelligenza artificiale voluta da Elon Musk e "alternativa" alla Partnership on AI di Amazon, Microsoft, Google e Facebook, ha messo a punto un algoritmo potenzialmente in grado di rivoluzionare sia il mondo dell'intelligenza artificiale sia quello della robotica industriale. Chiamato "One-shot imitation learning" (più o meno traducibile con "Apprendimento imitativo con un singolo tentativo"), unisce machine learning, intelligenza artificiale, realtà virtuale e, per l'appunto, robotica, in un unico "sforzo elaborativo".
Il nuovo algoritmo, presentato ufficialmente nella prima metà del 2017, dovrebbe consentire ai robot industriali di apprendere movimenti e azioni direttamente dall'uomo. Il trait d'union tra macchina e controparte umana è, per l'appunto, la realtà virtuale, trasformata per l'occasione in una sorta di "piattaforma educativa" nella quale gli automi sono in grado di apprendere da persone in carne e ossa.
Come funziona l'algoritmo one-shot imitation learning
Il sistema messo a punto dai tecnici di OpenAI prevede l'utilizzo di due reti neurali, ognuna delle quali dedicata a svolgere un compito ben preciso. La prima, chiamata vision network (rete della visione) riproduce il senso della vista e permette al robot (e agli apparati informatici che lo controllano) di "vedere" le azioni che un addestratore umano sta compiendo nella piattaforma educativa in realtà virtuale. La seconda, chiamata imitation network (rete dell'imitazione), analizza le dimostrazioni pratiche "viste" in realtà virtuale e tenta di scovare il senso dei movimenti e delle azioni compiute così da riuscire a generalizzare il processo e, successivamente, applicarlo e riprodurlo anche in situazioni differenti da quella di "addestramento".
È a questo punto che entrano in gioco intelligenza artificiale e machine learning. Affinché sia in grado di generalizzare i movimenti e gli scopi appresi nella realtà virtuale, la rete neurale per l'imitazione viene sottoposta a lunghissime sessioni di allenamento e addestramento: ogni singola azione viene ripetuta (nell'ambiente della realtà virtuale, ovviamente) migliaia e migliaia di volte, così che possa essere scomposta e analizzata in ogni sua singola (e minima) parte. Nel susseguirsi delle sessioni, le azioni vengono cambiate per "ambiente" o disposizione degli elementi utilizzati, in modo che gli automi possano imparare a estrapolare e "astrarre" le azioni dalla loro realizzazione pratica.
Costruire torri con blocchi colorati
Una delle prime azioni apprese e generalizzate dall'algoritmo one-shot imitation è stata quella della costruzione di torri fatte di blocchi di legno colorati. Affinché la macchina fosse in grado di generalizzare il processo di apprendimento, gli scienziati e i tecnici di OpenAI hanno fornito al loro algoritmo diversi "casi campione". Questo ha permesso alle reti neurali artificiali di scomporre l'azione in singoli movimenti e dedurre, per ognuno di essi, quale fosse lo scopo "ultimo". Per rendere tutto più "realistico", all'intelligenza artificiale sono stati forniti anche degli esempi conclusi con dei fallimenti (cubi impilati in maniera inesatta o tentativi andati a male): ciò ha permesso all'algoritmo di machine learning di riconoscere anche gli errori e dedurre come comportarsi e come "recuperare" nel caso in cui qualcosa fosse andato storto.