In un mondo più interconnesso che mai, superare la barriera linguistica è diventata una sfida imprescindibile. E per farlo Meta, il gigante della tecnologia precedentemente noto come Facebook, ha presentato un nuovo modello di intelligenza artificiale generativa. La promessa di SeamlessM4T è quella di accedere senza alcun sforzo ad una quantità di contenuti multilingue come mai prima d’ora consentendo la traduzione multimodale (voce e testo) e multilingue con un unico strumento.
Meta e l’impresa del traduttore linguistico universale
SeamlessM4T, che sta per Massively Multilingual and Multimodal Machine Translation, rappresenta un enorme passo avanti nell’ambizione di Meta di sviluppare un traduttore linguistico universale. Arriva dopo il modello di traduzione automatica da testo a testo No Language Left Behind, che vantava il supporto per 200 lingue.
SpeechMatrix, un dataset per la traduzione speech-to-speech multilingue, nonché Massively Multilingual Speech dedicato al riconoscimento vocale. Ed infine Universal Speech Translator, una vetrina in cui l'hokkien parlato, lingua ampiamente parlata in Cina ma priva di scrittura ufficiale, veniva convertito in inglese.
A differenza dei tradizionali sistemi speech-to-text e text-to-text limitati nella copertura linguistica, SeamlessM4T è progettato per comprendere e tradurre le interazioni da parlato a testo e da testo a testo per una gamma di quasi 100 lingue. Inoltre, per la traduzione vocale (speech-to-speech) e da testo a voce (text-to-speech), supporta quasi 100 lingue di input e 35 lingue di output.
Offrendo un approccio all-in-one che riduce al minimo errori e ritardi, SeamlessM4T migliora l'efficienza e la qualità dei processi di traduzione consentendo a persone provenienti da contesti linguistici diversi di impegnarsi in conversazioni multilingue senza problemi.
Ancora, potrebbe essere in grado di rilevare casi di commutazione di codice, un fenomeno in cui gli oratori passano senza soluzione di continuità tra due o più lingue all'interno di una singola frase. Un video illustrativo di Meta ha mostrato l'immediata differenziazione del modello tra le lingue hindi, telugu e inglese.
Spazio alle lingue meno diffuse e potere a ricercatori e sviluppatori
L’importanza della traduzione linguistica è amplificata per aziende come Meta, che impiegano una vasta forza lavoro per gestire il diluvio di contenuti Facebook e Instagram in varie lingue. Spesso, le lingue di minore importanza sono gestite da team più piccoli, che si affidano a sistemi di moderazione automatizzati che presentano carenze nella loro applicazione. Garantendo all’intelligenza artificiale l’accesso a set di dati che comprendono queste lingue meno diffuse, Meta immagina uno strumento per rafforzare i propri sforzi di moderazione.
Inoltre, nella decisione di rilasciare SeamlessM4T sotto una licenza Creative Commons CC BY-NC 4.0 è evidente l'impegno di Meta nei confronti della scienza aperta. Come con il modello di grandi dimensioni Llama 2, questa mossa invita ricercatori e sviluppatori a sfruttare un potente strumento di intelligenza artificiale, promuovendo l’innovazione nel campo della traduzione linguistica. Oltre a SeamlessM4T, Meta ha condiviso anche i metadati di SeamlessAlign, un set di dati di traduzione multimodale di notevole portata, che comprende oltre 270.000 ore di allineamenti di parlato e testo.
Uno scudo AI contro la tossicità e i pregiudizi
Oltre alle sue impressionanti capacità di traduzione, SeamlessM4T dimostra l'impegno di Meta nella creazione di un ambiente digitale sicuro e inclusivo. Man mano che SeamlessM4T prendeva forma, Meta ha creato un sistema in grado di identificare le parole tossiche che, come spiega l’azienda,comprendono casi in cui il contenuto tradotto può fomentare odio, violenza, linguaggio volgare o abuso. Per controbilanciare la tossicità nei dati di addestramento, Meta ha rimosso le sequenze in cui input o output contenevano vari gradi di tossicità.
Un aspetto nuovo risiede nell'abilità del modello di rilevare e quantificare i pregiudizi di genere all'interno delle lingue. Questa metodologia prevede il conteggio dei casi in cui nelle traduzioni vengono introdotte parole di genere, nonostante l'assenza di distinzioni nella lingua originale, simile alla presunzione automatica di una connotazione maschile per la parola "doctor" in inglese. Filtrando il linguaggio tossico e affrontando i costrutti linguistici di genere, SeamlessM4T mira a garantire che il contenuto tradotto rimanga rispettoso e imparziale.