Gli assistenti virtuali, ossia le intelligenze artificiali in grado di interagire con noi grazie alla nostra voce o a un input manuale, diventeranno la normalità un po' ovunque. Nel prossimo futuro (meno lontano di quello che possiate pensare) li troveremo sia nelle abitazioni sia negli uffici, ma anche nelle auto, nei luoghi pubblici e nei negozi. Insomma, per svolgere le azioni più variegate nei prossimi anni utilizzeremo la nostra voce per dare comandi un'intelligenza artificiale e farci aiutare da quest'ultima. Per far sì che per le persone sia normale interagire con gli assistenti virtuali sarà però fondamentale che la voce delle AI sia il più naturale possibile. Al momento, infatti, la maggior parte degli assistenti vocali per smart-home, smartphone o altri servizi ha una voce troppo metallica che può creare un senso distacco in chi la usa.
Fino ad oggi gli assistenti virtuali con voci suadenti, sia maschili che femminili, li abbiamo visti solo nei film di fantascienza. Da Star Trek a Valerian, i vari protagonisti del grande schermo erano aiutati da assistenti vocali con una voce identica a quella umana e dotati anche dell'ironia e dei cambi di tonalità tipici di un uomo quando parla e cambia argomento o sentimento. L'obiettivo che si sono posti alcune aziende importanti operanti nel campo degli assistenti virtuali, come Apple, Amazon e Google, però è lo stesso che abbiamo visto al cinema. Creare delle AI con una voce davvero umana che non crei difficoltà alle persone nell'utilizzarla per qualsiasi ricerca o azione di tutti i giorni.
Va detto che nel corso degli ultimi anni i passi in avanti fatti dalla tecnologia per migliorare la voce degli assistenti virtuali sono stati impressionanti. Pensiamo, se possediamo un iPhone, a come è cambiata la voce di Siri rispetto a solo qualche anno fa. Ora l'Ai di Cupertino ha una voce molto più simile a quella umana e molto meno robotica rispetto al passato. Discorso simile si può fare anche per la voce di Google Assistant, l'AI che Mountain View ha iniziato a usare da poco tempo sui vari smartphone e oggetti intelligenti per la smart-home.
Lo sviluppo degli assistenti virtuali
Per capire dove potranno arrivare gli assistenti virtuali in futuro bisogna per forza di cose fare un passo indietro. Tra la fine degli Anni '90 del secolo scorso e gli inizi degli Anni 2000 gli utenti hanno iniziato ad abituarsi ad interagire con una voce robotica registrata, soprattutto per gestire alcune operazioni molto semplice. Come il sistema di smistamento delle chiamate di un call center o di un servizio clienti oppure come gli strumenti per la lettura di testi sui computer per persone con disturbi alla vista e così via. Si trattava di programmi davvero basici e dotati di una voce davvero robotica e straniante.
Nel 2011 Apple ha in parte rivoluzionato questa tecnologia su larga scala inserendo Siri nei suoi iPhone e iPad. Siri apparì per la prima volta su un iPhone 4S e fu uno dei motivi del grande successo di vendite per Cupertino con quel particolare modello. Per rispondere a Siri, nel 2014 sia Amazon (con Alexa) che Microsoft (con Cortana) presentarono al mondo i loro assistenti vocali dotati di intelligenza artificiale. Google, invece, arriva con un po' di ritardo e solo nel 2016 presenta l'Assistente Google. In poco tempo però Mountain View con il suo Assistant riscuote un grande successo e ora il suo assistente virtuale è tra i più usati al mondo. Anche perché di recente Google Assistant è stato il primo AI del suo genere a diventare bilingue, ossia può parlare sia l'italiano, per esempio, che l'inglese in contemporanea.
Cosa renderà le voci virtuali piacevoli
Come detto molte aziende stanno cercando di capire come rendere al meglio una voce robotica e adattarla al suono ricevuto dall'orecchio umano. In pratica da anni Apple, Google, Amazon e tutte le altre aziende stanno insegnando tramite l'apprendimento automatico alle varie intelligenze artificiali a copiare il tono della voce umana. Anche in relazione a quello che dicono. Uno dei problemi principali degli assistenti virtuali fino ad oggi infatti è stato quello di parlare con un tono di voce monocorde, senza cioè enfatizzare passaggi o parole chiave durante una conversazione con l'uomo.
Inoltre, è probabile che in futuro i vari assistenti vocali avranno una voce che si adatterà a ciò che fanno e con chi parlano. Per capirci un assistente virtuale installato in un aeroporto, in una stazione o in un luogo pubblico avrà un modo molto formale e disponibile di approcciarsi alle persone, usando parole e toni di voce rassicuranti e cordiali. Un assistente installato in un negozio userà uno stile meno formale e userà parole improntate alla vendita dando anche consigli agli utenti usando sempre un tono cordiale. Un assistente virtuale installato su uno smartphone o su un device per la smart home invece potrebbe avere una voce molto diversa, con un tono meno informale e impostato e usare termini linguistici che si adattano all'età della persona con cui parla. Per esempio, il linguaggio usato con un adolescente non sarà lo stesso scelto se l'Ai interagirà con una persona adulta. E allo stesso tempo la voce maschile o femminile potrà essere impostata dall'utente a proprio piacimento e non sarà standard.
Stando a una prima ricerca effettuata nel 2005 comunque la maggior parte delle persone, sia uomini che donne, sono più propensi ad interagire e a raccogliere informazioni da una voce virtuale con tonalità maschili. Probabilmente per un retaggio culturale. Stando alle ultime analisi delle varie aziende però in alcuni campi, come la vendita o l'assistenza clienti le persone sono più propense ad interagire con una voce femminile invece che maschile. Possono sembrare dettagli, ma sono scelte che faranno la differenza per la diffusione futura di questa tecnologia nelle case, nei negozi e in generale in moltissimi luoghi pubblici. Non è un caso che Apple negli ultimi anni abbia ridotto del 21% le tonalità della voce femminile di Siri per avvicinarla al suono di una voce maschile, rendendola così più adatta ad alcune operazioni che richiedevano l'indicazione precisa di comandi e creando una voce più "umana" per il nostro orecchio. In pratica una delle sfide più grandi è trovare una voce che possa aiutare anche dando dei comandi da fare alle persone. Non tutti infatti sono propensi a ricevere ordini da una voce robotica, anche se simile a quella umana e maschile o femminile che sia.