In Breve (TL;DR)
- OmniHuman-1 è una nuova AI sviluppata da ByteDance, azienda madre di TikTok, capace di generare video iper-realistici partendo da una singola immagine.
- Lo strumento può creare contenuti con soggetti umani che parlano, cantano o ballano con movimenti fluidi e sincronizzati, ma solleva preoccupazioni per i possibili usi nei deepfake e nella disinformazione.
ByteDance, azienda nota in tutto il mondo per aver lanciato sul mercato TikTok, il famoso social network utilizzato in tutto il mondo, è entrata nel mondo dell’intelligenza artificiale. Come la maggior parte dei suoi competitor, infatti, ha deciso di realizzare strumenti basati sull’intelligenza artificiale per semplificare alcune delle attività che gli utenti svolgono online o per rendere possibile la creazione di contenuti in maniera semplice e veloce. Ha, così, creato OmniHuman-1, un interessante strumento AI.
OmniHuman-1 può essere considerata un’AI sorella di TikTok. Dotato di un potente algoritmo, questo strumento rende possibile la generazione di video iper-realistici. Uno strumento dai tanti vantaggi, ma che comporta anche qualche rischio da tenere sotto controllo.
Scopriamo cos’è e come funziona OmniHuman-1 e chi può avere accesso al nuovo strumento realizzato da ByteDance.
Che cos’è e cosa può fare OmniHuman-1, l’AI di ByteDance
OmniHuman è una nuova AI, sviluppata da ricercatori di ByteDance. Ciò che riesce a fare è la creazione di video estremamente realistici, che possono avere come protagonisti soggetti umani. La simulazione del movimento umano è estremamente preciso ed è in grado di lavorare su soggetti a corpo intero, a mezzo busto o su primi piani che riguardano il viso.
I contenuti prodotti da OmniHuman attraverso l’intelligenza artificiale possono essere una combinazione di audio e video o presentare solo uno di questi due elementi. Si può partire da una singole immagine umana inserita come input, offrendo indicazioni di movimento e di audio. Il risultato promette di essere soddisfacente: filmati perfettamente fluidi, con movimenti realistici e audio e video sincronizzati.
C’è un’elevata attenzione per i dettagli, essenziale per garantire la realisticità del contenuto. Espressioni facciali, interazione con l’ambiente, movimenti del corpo e altri elementi sono tutti estremamente curati.
Quali contenuti si possono creare con OmniHuman-1 di Byte Dance e come usarlo
Le possibilità di creazione con OmniHuman-1 sono tantissime. Si possono creare video di persone che cantano e che ballano, che parlano con una perfetta coordinazione tra voce e movimenti delle labbra, anime e cartoni animati e tanto altro ancora.
Vi si possono creare influencer virtuali, contenuti educativi, tutorial, video per i social network e tutto ciò che si desidera. Tanti i vantaggi, ma sono presenti anche dei rischi. L’elevata realisticità dei video potrebbe portare alla nascita di deepfake e alla diffusione della disinformazione. È bene utilizzare questo strumento con la massima attenzione e consapevolezza.
Per iniziare la generazione di un video, l’utente deve partire da una singola immagine che può rappresentare una persona, un personaggio, se stessi o disegni di cartoni animati. A questo punto si aggiunge una clip audio, che serve da segnale di movimento. In base all’audio, OmniHuman crea il movimento dell’immagine.