Meta presenta SeamlessM4T, un traduttore AI multimodale e multilingue

Ascolta l'articolo

SeamlessM4T è il modello AI di Meta che può eseguire traduzioni da voce a testo, da voce a voce, da testo a voce e da testo a testo per un massimo di 100 lingue

SeamlessM4T modello AI traduzioni di Meta

Ascannio / Shutterstock.com

Qual è il tuo Rapporto con l’Intelligenza Artificiale?
Fai il test

LinkedIn X Facebook WhatsApp Email

Crea una playlist
Condividi l'articolo

LinkedIn X Facebook WhatsApp Email

In un mondo più interconnesso che mai, superare la barriera linguistica è diventata una sfida imprescindibile. E per farlo Meta, il gigante della tecnologia precedentemente noto come Facebook, ha presentato un nuovo modello di intelligenza artificiale generativa. La promessa di SeamlessM4T è quella di accedere senza alcun sforzo ad una quantità di contenuti multilingue come mai prima d’ora consentendo la traduzione multimodale (voce e testo) e multilingue con un unico strumento.

Meta e l’impresa del traduttore linguistico universale

SeamlessM4T, che sta per Massively Multilingual and Multimodal Machine Translation, rappresenta un enorme passo avanti nell’ambizione di Meta di sviluppare un traduttore linguistico universale. Arriva dopo il modello di traduzione automatica da testo a testo No Language Left Behind, che vantava il supporto per 200 lingue.

SpeechMatrix, un dataset per la traduzione speech-to-speech multilingue, nonché Massively Multilingual Speech dedicato al riconoscimento vocale. Ed infine Universal Speech Translator, una vetrina in cui l'hokkien parlato, lingua ampiamente parlata in Cina ma priva di scrittura ufficiale, veniva convertito in inglese.

Fastweb Mobile Full

10,95€/mese

Internet 200 GB e Minuti illimitati

Spedizione SIM GRATIS

scopri

A differenza dei tradizionali sistemi speech-to-text e text-to-text limitati nella copertura linguistica, SeamlessM4T è progettato per comprendere e tradurre le interazioni da parlato a testo e da testo a testo per una gamma di quasi 100 lingue. Inoltre, per la traduzione vocale (speech-to-speech) e da testo a voce (text-to-speech), supporta quasi 100 lingue di input e 35 lingue di output.

Offrendo un approccio all-in-one che riduce al minimo errori e ritardi, SeamlessM4T migliora l'efficienza e la qualità dei processi di traduzione consentendo a persone provenienti da contesti linguistici diversi di impegnarsi in conversazioni multilingue senza problemi.

Ancora, potrebbe essere in grado di rilevare casi di commutazione di codice, un fenomeno in cui gli oratori passano senza soluzione di continuità tra due o più lingue all'interno di una singola frase. Un video illustrativo di Meta ha mostrato l'immediata differenziazione del modello tra le lingue hindi, telugu e inglese.

Spazio alle lingue meno diffuse e potere a ricercatori e sviluppatori

L’importanza della traduzione linguistica è amplificata per aziende come Meta, che impiegano una vasta forza lavoro per gestire il diluvio di contenuti Facebook e Instagram in varie lingue. Spesso, le lingue di minore importanza sono gestite da team più piccoli, che si affidano a sistemi di moderazione automatizzati che presentano carenze nella loro applicazione. Garantendo all’intelligenza artificiale l’accesso a set di dati che comprendono queste lingue meno diffuse, Meta immagina uno strumento per rafforzare i propri sforzi di moderazione.

Inoltre, nella decisione di rilasciare SeamlessM4T sotto una licenza Creative Commons CC BY-NC 4.0 è evidente l'impegno di Meta nei confronti della scienza aperta. Come con il modello di grandi dimensioni Llama 2, questa mossa invita ricercatori e sviluppatori a sfruttare un potente strumento di intelligenza artificiale, promuovendo l’innovazione nel campo della traduzione linguistica. Oltre a SeamlessM4T, Meta ha condiviso anche i metadati di SeamlessAlign, un set di dati di traduzione multimodale di notevole portata, che comprende oltre 270.000 ore di allineamenti di parlato e testo.

Uno scudo AI contro la tossicità e i pregiudizi

Oltre alle sue impressionanti capacità di traduzione, SeamlessM4T dimostra l'impegno di Meta nella creazione di un ambiente digitale sicuro e inclusivo. Man mano che SeamlessM4T prendeva forma, Meta ha creato un sistema in grado di identificare le parole tossiche che, come spiega l’azienda,comprendono casi in cui il contenuto tradotto può fomentare odio, violenza, linguaggio volgare o abuso. Per controbilanciare la tossicità nei dati di addestramento, Meta ha rimosso le sequenze in cui input o output contenevano vari gradi di tossicità.

Un aspetto nuovo risiede nell'abilità del modello di rilevare e quantificare i pregiudizi di genere all'interno delle lingue. Questa metodologia prevede il conteggio dei casi in cui nelle traduzioni vengono introdotte parole di genere, nonostante l'assenza di distinzioni nella lingua originale, simile alla presunzione automatica di una connotazione maschile per la parola "doctor" in inglese. Filtrando il linguaggio tossico e affrontando i costrutti linguistici di genere, SeamlessM4T mira a garantire che il contenuto tradotto rimanga rispettoso e imparziale.

A cura di Cultur-e

Topic:

Intelligenza Artificiale

#CuriositaTech

#DigitalDevelopment

#NuoveTecnologie

Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.

Fda

L'IA nel mondo del lavoro

L'IA nel mondo del lavoro

Impatti, sfide e opportunità

Iscriviti al corso gratuito

LinkedIn X Facebook WhatsApp Email

Cos'è Gemini Live e come cambiano le tue ricerche immagini e video

Google ha confermato che le funzioni di Gemini Live per la condivisione dello schermo e utilizzo della fotocamera saranno disponibili gratuitamente per tutti

Dev & Security

Addio a Google.it, cosa cambia se tutte le ricerche si faranno su Google.com

Google.it chiude i battenti, così come tutti i domini locali del motore di ricerca del colosso di Mountain View. Cosa succede adesso e cosa cambierà

Dev & Security

Come cambia ChatGPT con o3 e o4-mini, i nuovi modelli AI di OpenAI

OpenAI, a poche ore dal lancio di GPT 4.1, rilascia due nuovi modelli per ChatGPT: o3 e o4-mini. Sono economici, ma hanno capacità elevate di ragionamento

Scopri i corsi gratuiti della Fastweb Digital Academy

Introduzione agli NFT

Abbiamo sentito parlare degli NFT per merito delle famose scimmie milionarie, le Bored Apes, e per molti sono delle immagini con dei costi…

Introduzione alla programmazione in Python

Il Deep Learning è una tecnologia che comprende diverse discipline e le principali sono l’informatica e la programmazione. Il Deep Learning, infatti…

Low-Code/No-Code: sbloccare efficienza, innovazione e crescita con l'automazione e le applicazioni senza codice