login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Il nuovo modello AI di Alibaba è in grado di capire le emozioni umane

Ascolta l'articolo

R1-Omni è il nuovo modello di intelligenza artificiale di Alibaba sviluppato per comprendere le emozioni umane. Come funziona e in che modo può essere usato

Intelligenza Artificiale Alibaba aslysun/Shutterstock

In Breve (TL;DR)

  • Alibaba ha sviluppato R1-Omni, un modello AI in grado di riconoscere e interpretare le emozioni umane attraverso analisi visiva, audio e del linguaggio del corpo.
  • Il sistema, basato su HumanOmni-0.5B, punta a migliorare assistenti virtuali, telemedicina e intrattenimento, avvicinandosi all’Intelligenza Artificiale Generale (AGI).

In questi giorni Alibaba ha presentato R1-Omni, un avanzato modello di intelligenza artificiale sviluppato per riconoscere e interpretare le emozioni umane nei video.

Questo nuovo strumento è basato sul modello open-source HumanOmni-0.5B sviluppato dal capo ricercatore Jiaxing Zhao e rappresenta un passo significativo verso l'intelligenza artificiale generale (AGI).

Al momento, stando a una demo pubblicata su GitHub, R1-Omni è capace di analizzare brevi clip video, comprendendo il loro stato emotivo attraverso una combinazione di analisi visiva e audio.

Come funziona R1-Omni

Il nuovo strumento basato sull’intelligenza artificiale di Alibaba utilizza un approccio multimodale per il riconoscimento delle emozioni, appoggiandosi a vari livelli di analisi.

Si parte con le analisi delle espressioni facciali, con questo strumento che è in grado di rilevare le micro-espressioni e variazioni nei tratti del volto così da identificare alcune tra le emozioni più comi come gioia, tristezza, rabbia o stupore.

Si passa poi all’interpretazione del linguaggio del corpo, con R1-Omni che studia la postura e i movimenti delle persone per comprendere stati emotivi più complessi come disagio, insicurezza o entusiasmo.

La fase successiva passa per l’analisi del tono della voce che gli consente di riconoscere le variazioni nel timbro, nel ritmo e nell’intonazione per interpretare gli stati emotivi anche quando l’espressione facciale è neutra o poco visibile.

L’ultima particolarità di questo strumento AI sta nell’elaborazione del linguaggio naturale (NLP) che, per arrivare a un’analisi ancora più approfondita, passa per la comprensione del contenuto parlato e scritto per contestualizzare le emozioni espresse nelle conversazioni.

Il primo passo verso l’Intelligenza Artificiale Generale (AGI)

L’obiettivo principale di R1-Omni è rendere le interazioni uomo-macchina più fluide ed empatiche portando dei sostanziali miglioramenti in diversi ambiti tra cui: i servizi di assistenza virtuale che con l’arrivo di assistenti IA più intuitivi e reattivi, potrebbero modulare le risposte in base allo stato emotivo dell'utente.

Questo strumento potrebbe anche rivoluzionare il settore della telemedicina e del supporto psicologico, con diagnosi più accurate e interazioni più umane nei servizi sanitari basati su IA.

Infine, R1-Omni potrebbe stravolgere anche l’intrattenimento e i social media, proponendo all’utente contenuti in base alle reazioni emotive riscontrate.

I piani futuri di Alibaba, stando alle dichiarazioni dell’azienda stessa, prevedono di avvicinarsi all'AGI, un’intelligenza artificiale capace di eguagliare e superare le capacità cognitive umane in molteplici contesti e in questo senso R1-Omni rappresenta un tassello fondamentale in questa strategia.

L’arrivo di modelli del genere segna una grande evoluzione nel modo in cui le macchine possono comprendere e rispondere alle emozioni umane, aprendo scenari innovativi per il futuro dell’interazione uomo-AI.

Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi

Domande frequenti (FAQ)

  • Come funziona R1-Omni?
    Il nuovo strumento basato sull’intelligenza artificiale di Alibaba utilizza un approccio multimodale per il riconoscimento delle emozioni, appoggiandosi a vari livelli di analisi.
  • Quali sono le fasi di analisi delle emozioni svolte da R1-Omni?
    R1-Omni analizza le espressioni facciali, il linguaggio del corpo, il tono della voce e il linguaggio naturale per comprendere le emozioni umane nei video.
  • Qual è l'obiettivo principale di R1-Omni?
    L'obiettivo principale di R1-Omni è rendere le interazioni uomo-macchina più fluide ed empatiche, migliorando diversi ambiti come l'assistenza virtuale, la telemedicina e l'intrattenimento.
A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
TecnologicaMente
Qual è il tuo stile di Comunicazione Digitale?
Immagine principale del blocco
Qual è il tuo stile di Comunicazione Digitale?
Fda gratis svg
Scopri come ti esprimi online: Emoji lover, impeccabile o essenziale
Fai il test gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.