Stando alle dichiarazioni di OpenAI, la nuova modalità vocale avanzata di ChatGPT è attualmente disponibile per un ristretto numero di utenti iscritti a ChatGPT Plus.
La caratteristica è stata mostrata per la prima volta nel corso dell’evento di presentazione di GPT-4o ma, sin da subito, ha sollevato diversi dubbi negli utenti per motivi di sicurezza, cosa che ha contribuito al ritardo nella distribuzione.
Ora che la funzione sembra essere stata perfezionata, OpenAI è pronta per il lancio che dovrebbe avvenire già dalle prossime settimane.
Cosa sappiamo della modalità vocale avanzata
Le ultime informazioni utili sulla modalità vocale avanzata di ChatGPT risalgono allo scorso maggio, quando il tool ha fatto la sua comparsa durante la presentazione di GPT-4o, mostrando subito le sue grandi potenzialità rispetto all’attuale modalità vocale.
Il vero punto di forza di questa caratteristica è stato mostrato chiaramente dalle “continue interruzioni” dei dipendenti di OpenAI che chiedevano al chatbot, in tempo reale, di raccontare una storia in modi diversi, riadattando di volta in volta il suo tono in base alle richieste.
Durante le brevi pause dovute alle interruzioni, in tempi rapidissimi ChatGPT è stato in grado di aggiustare il tiro e adattare le risposte seguendo per filo e per segno le richieste.
Nonostante quest’ottima premessa, però, il tool ha ricevuto un bel po’ di critiche dopo l’evento, soprattutto da chi ha affermato che Sky, la “voce umana” data al chatbot, somigliasse in maniera troppo evidente a quella di Scarlett Johansson.
La cosa curiosa è che l’attrice già in passato ha dato voce a un chatbot AI, più precisamente nel film Her, una pellicola controversa che riletta in chiave moderna fa riflettere non poco; così come questa strana somiglianza nella voce.
Per far fronte a questa insolita casualità, OpenAI si è presa del tempo per ritoccare la voce cercando di allontanarla da quella dell’attrice (che intanto ha confermato di aver inviato diverse lettere all’azienda per sapere di più sulla cosa).
Per questo motivo, per risolvere ogni dubbio, il chatbot avrà a disposizione quattro voci differenti, create grazie al lavoro congiunto con alcuni doppiatori.
Oltre a questo, l’azienda si è dovuta occupare anche di “rivedere” le sue politiche sulla sicurezza, altro interrogativo sollevato dagli utenti alla presentazione del tool.
Da quello che sappiamo sono stati aggiunti dei filtri che riconosceranno e bloccheranno determinate richieste come quelle di generare musica o altre tipologie di audio protetti da copyright.
In più è stato anche introdotto il limite che impone al tool di non impersonare voci di altre persone, incluse quelle di personaggi noti, bloccando anche in questo caso ogni tentativo del genere da parte degli utenti.
Quando arrivano le nuove funzioni
Nonostante questo leggerissimo ritardo, comunque, OpenAI conta di rilasciare la nuova modalità vocale avanzata entro l’autunno, riservandola al momento per gli abbonati a ChatGPT Plus.
Chiaramente, la novità sarà riservata inizialmente agli utenti inglesi e, in un secondo momento, arriverà anche per tutti gli altri ma non sono ancora state rilasciare maggior informazioni al riguardo.
Per saperne di più: ChatGPT, cos’è, come funziona, a cosa serve, come usarla gratis