In Breve (TL;DR)
- Google ha lanciato Veo 2 e Imagen 3 per creare video e immagini realistici, migliorando dettagli e precisione.
- Integrati con Google Gemini, i nuovi strumenti includono Whisk per usare immagini come prompt, con Veo 2 disponibile inizialmente su VideoFX.
Google, che ha annunciato ufficialmente l’arrivo di nuove funzioni basate sull’intelligenza artificiale dedicate alla generazione di foto e video realistici.
Parliamo, nello specifico di Veo 2, versione migliorata de modello AI per la creazione di video presentato durante il Google I/O 2024 e dell’update di Imagen 3, che migliora ulteriormente promettendo immagini in alta qualità e ricche di dettagli.
Insomma, entrambe le novità rappresentano un significativo passo avanti per Big G nella creazione di contenuti multimediali attraverso l’intelligenza artificiale che, mai come adesso, diventano realistici e quanto più simili al mondo reale.
Veo 2 e Imagen 3, le novità presentate da Google
Per quanto riguarda Veo 2, le informazioni riportate nel comunicato stampa condiviso da Google parlano della capacità di questo modello di riprodurre in modo estremamente preciso le espressioni umane e i movimenti del corpo con un elevatissimo livello di dettaglio.
Per farlo, ovviamente, si parte da un prompt testuale con Big G che permette agli utenti di specificare in modo più o meno preciso ciò di cui hanno bisogno, chiedendo, ad esempio, determinati dettagli cinematografici (come il tipo di inquadratura o i vari effetti da usare) in modo da rendere ancora più coerente il risultato finale e pienamente allineato al volere dell’utente.
Le possibilità sono davvero molte e, chi ha competenze in materia, può creare il proprio video praticamente da zero, fornendo all’AI tutti i particolari che ha in mente, per una resa visiva che davvero ha dell’incredibile.
Molto importante per Google anche il discorso sui contenuti generati dall’AI: ogni video prodotto con Veo 2 viene passato attraverso SynthID, che può essere pensato come una specie di watermark che non appare sul prodotto finale, ma permette ai sistemi informatici di riconoscere i contenuti creati con l’intelligenza artificiale, evitando che video fake vengano spacciati per reali.
Come già anticipato al fianco di Veo 2 sono arrivati anche i tanto attesi aggiornamenti di Imagen 3, il modello AI di Google che si occupa della generazione immagini.
Con l’update, le foto create sono molto più luminose, presentano una composizione migliore e un livello di dettaglio maggiore cosa che rende le immagini ancora più realistiche.
Infine Big G ha presentato Whisk, uno strumento che combina le potenzialità di Imagen 3 con le funzioni di comprensione visiva di Google Gemini e che consente agli utenti di utilizzare immagini come prompt di partenza per la creazione di nuovi contenuti originali.
Quando arrivano le nuove funzioni AI di Google
Stando alle dichiarazioni di Google la distribuzione di Veo 2 sarà graduale e bisognerà accedervi tramite una lista di attesa attraverso VideoFX, presente all’interno di Google Labs.
Al momento, però, l’Italia non è tra i paesi in cui è possibile provare l’anteprima del servizio e per ora non resta che attendere maggiori dichiarazioni da parte dell’azienda di Mountain View.
Dal prossimo anno, comunque, la funzione sarà integrata all’interno di diversi prodotti dell’ecosistema di Big G e dovrebbe dunque essere disponibile anche nel nostro Paese.
Per quanto riguarda Imagen 3, invece, la nuova versione è già in fase di distribuzione in tutto il mondo, sempre tramite ImageFX.
Infine c’è Whisk che, al momento, è limitato ai soli Stati Uniti, ma chi vuole può sempre utilizzare un servizio di VPN per geolocalizzarsi negli USA e accedere al tool.
Per saperne di più: Google Gemini, cos’è e come funziona la nuova AI Multimodale di Google