Le immagini generate dall'intelligenza artificiale sono ovunque ed è facile capire perché: gli strumenti che le realizzano ora sono buoni e disponibili al pubblico. Gli AI image generator prendono un prompt di testo e poi lo trasformano, nel miglior modo possibile, in un'immagine corrispondente.
Gli unici veri limiti sono l’immaginazione, la capacità del generatore di comprendere il prompt e qualsiasi filtro di contenuto per impedire ai malintenzionati di inondare Internet con contenuti violenti o potenzialmente offensivi.
Il funzionamento è simile. Miliardi di coppie immagine-testo vengono utilizzate per addestrare una rete neurale (un algoritmo sofisticato modellato sul cervello umano) di modo che sia in grado di interpretare qualsiasi prompt.
Il passaggio successivo consiste nel generare l'immagine utilizzando un processo di diffusion. In sostanza, iniziano con un campo di rumore casuale e poi lo modificano in una serie di passaggi in modo che corrispondano alla interpretazione del prompt.
Le tecnologie AI di generazione di immagini, come DALL-E, Midjourney e Stable Diffusion, hanno conosciuto un'ascesa vertiginosa nel panorama mainstream. E nuovi strumenti sembrano spuntare continuamente, ma non sono sempre disponibili al pubblico. Ecco quelli che possiamo usare adesso.
DALL-E
Credits Diego Thomazini / Shutterstock.com
Sviluppato da OpenAI nel 2021, DALL-E è il primo sistema di IA di cui si è sentito parlare per la sua capacità di generare immagini di alta qualità da semplici descrizioni testuali. Ciò che contraddistingue DALL-E, ora evoluto in DALL-E 2, è che è incredibilmente semplice da usare. Molti lo considerano il migliore, anche se la concorrenza sta guadagnando terreno.
Da settembre 2022 qualsiasi utente può iscriversi senza una lista d'attesa. Si ricevono inizialmente 50 crediti gratuiti, successivamente 15 al mese. Anche se si possono acquistare pacchetti di 115 crediti a 15 dollari. Ogni credito consente di generare quattro varianti di immagine da un singolo prompt.
Nonostante sia semplice da usare, DALL-E 2 ha alcune potenti funzionalità. L'editor di immagini consente di aggiungere ulteriori frame, in modo da arricchire l'immagine originale (out-painting). C'è anche una gomma, con cui rimuovere frammenti di un'immagine e sostituirli con elementi generati dall'IA (in-painting).Oltre alla Web app, OpenAI offre un'API che consente agli sviluppatori di creare app che integrano il software.
Bing Image Creator
Credits Bing Image Creator
Dopo il lancio della Bing Chat AI a febbraio 2023, Microsoft lo ben presto accoppiato ad un generatore di immagini alimentato da una versione avanzata del modello DALL-E. Tuttavia, rispetto alla versione ufficiale DALL-E 2, l’utilizzo di Bing Image Creator non è limitato a 15 creazioni gratuite al mese.
Ogni settimana si hanno 25 "boost" a disposizione per velocizzare la generazione di immagini. Una volta esauriti, il processo richiederà solo un po’ di tempo in più. Per utilizzare Bing Image Creator basta accedere al sito web. È semplice e facile da usare: tutto ciò di cui si ha bisogno è un account Microsoft.
Midjourney
Credits salarko / Shutterstock.com
Un altro AI image generator molto conosciuto, primo a vincere un concorso artistico, è Midjourney. Le immagini che crea sono molto coerenti e visivamente accattivanti. Le persone e gli oggetti del mondo reale sembrano più naturali di quanto non facciano altri.
Sfortunatamente, la beta di Midjourney è accessibile solo tramite account Discord. Dopo che ci si è uniti al server Discord Midjourney o si è invitato il bot Midjourney a un server proprio, bisogna inserire un prompt del tipo “/immagina [qualsiasi cosa si voglia vedere]”. Il bot genererà quindi quattro varianti del prompt, che si potranno scaricare, migliorare, modificare nuovamente ecc.
Per impostazione predefinita, ogni immagine viene condivisa pubblicamente su Discord quindi chiunque può vedere cosa stiamo creando. Sebbene non sia necessariamente un problema per gli artisti, potrebbe essere un rompicapo se si sta cercando di utilizzare Midjourney per scopi commerciali.
Midjourney offre una guida per iniziare. La prova gratuita limita a circa 25 prompt e a una licenza non commerciale CC BY-NC 4.0 Creative Commons. Il piano di abbonamento base parte da $ 10 al mese e include circa 200 prompt con la possibilità di acquistare tempo GPU aggiuntivo e diritti di utilizzo commerciale.
Stable Diffusion
Credits Zhuravlev Andrey / Shutterstock.com
Può creare immagini da prompt di testo, modificare immagini esistenti, migliorare quelle sfocate e generare video utilizzando un'estensione. Ma a differenza di DALL-E 2 e Midjourney, Stable Diffusion è open source. Chiunque abbia le competenze tecniche necessarie può scaricarlo ed eseguirlo localmente sul computer. Inoltre, è possibile addestrare e mettere a punto il modello per scopi specifici.
Stable Diffusion è disponibile anche in una app pubblica in beta di Stability AI. DreamStudio offre un enorme controllo sui vari aspetti della generazione di un'immagine con l'IA. Ci sono dei cursori per definire la dimensione dell'immagine finale, la fedeltà all’istruzione fornita, il numero di passaggi che compie il modello e delle immagini generate. Si può anche selezionare la versione dell'algoritmo e inserire un metodo di campionamento in modo da ottenere risultati ripetibili e non casuali.
In alternativa, è possibile provare una demo di Stable Diffusion sul web. Ci sono anche altri siti che ospitano Stable Diffusion online stilati da questo subreddit di Stable Diffusion.
Leonardo AI
Credits Leonardo.ai
Anche Leonardo.AI è incredibilmente bravo a generare immagini d’effetto e ha alcune caratteristiche interessanti come la possibilità di selezionare modelli (Deliberate 1.1, Luma, Leonardo creative, ecc.) o addestrare i propri caricando diverse immagini con uno stile simile e poi salvarlo per le illustrazioni future. Peraltro è possibile condividerlo con la community.
Oltre alla velocità e alla qualità dell'output, Leonardo.AI si distingue per la gratuità dell’offerta. Per ottenere l’accesso basta andare sul sito e fare clic sul pulsante “Get early access”. Aggiungendo l’email, verrà quindi inviato un link per unirsi al canale discord. Dopodiché basta presentarsi e compilare un modulo e in 24 ore o poco più, l'invito arriverà via e-mail.
Craiyon (DALL-E Mini)
CreditsCraiyon
La popolarità di DALL-E Mini ha raggiunto nuove vette grazie all'attenzione mediatica suscitata dall'arrivo di DALL-E 2. Per evitare confusione poi, si è scelto di chiamarlo "Craiyon". Un po’ meno impressionante degli altri, questo web tool è semplicissimo da usare e non richiede nessun account. Basta inserire un prompt di testo e lasciar lavorare l’IA.
NightCafe
Credits NightCafe
Fondato da Angus Russell nel novembre 2019, NightCafe è uno strumento web che crea immagini da istruzioni in linguaggio naturale in stili artistici specifici come "pittura a olio", "fantasy" o "gioco 3D".
Inoltre, con NightCafe è possibile creare video e contare su una comunità abbastanza importante. Il limite è di 5 creazioni gratuite ogni giorno e il processo può essere un po' lento a causa del traffico intenso. I pacchetti di crediti aggiuntivi partono da $ 7,99.
Dream by Wombo
Credits Dream by Wombo
Simile a NightCafe, Dream, progettato dalla canadese WOMBO abbina i prompt di testo a stili artistici, come "poligono", "realistico", "meme" e "line-art". Ma si può anche decidere di non utilizzarli. Dream è accessibile sul web e c'è anche una versione mobile che oggi conta oltre 140 milioni di installazioni. Inoltre, è gratuito e non ci sono soglie giornaliere.
Per saperne di più: Intelligenza Artificiale, cos'è e cosa può fare per noi