Midjourney è un sistema di intelligenza artificiale generativa del tipo text-to-image. Questo significa che è capace di generare immagini partendo da istruzioni testuali. L’unico modo per interagire con il Midjourney Bot è su Discord e per farlo, bisogna inserire nel prompt comandi appropriati.
Sono diverse le richieste che si possono sottoporre a Midjourney, ma una delle più famose consiste nel comando“/imagine” che permette digenerare quattro diversi tentativi di immagine partendo da una breve descrizione testuale.
Anche se il modello non è perfetto, Midjourney è uno strumento potente per sbloccare la creatività e l’immaginazione. Per questo, la cosa più importante è dedicare la giusta attenzione alle tecniche di prompt engineering per ottenere nel più breve tempo possibile il risultato sperato.
-
1. Cosa sono e come funzionano i parametri su Midjourney
DIA TV / Shutterstock.com
Anzitutto, bisogna considerare che il Midjourney Bot funziona meglio con frasi semplici che descrivono esattamente ciò che si vuole vedere, un po’ in stile “telegramma” e quindi è bene cercare di essere concisi ed essenziali nella scelta delle parole.
Nello specifico, i parametri sono opzioni aggiunte alla fine di un prompt per modificare la modalità di generazione di un'immagine. Possono cambiare le proporzioni, lo stile, il rumore visivo, ma anche le versioni del modello di intelligenza artificiale che alimenta Midjourney.
Più dettagli si aggiungono e più il bot avrà materiale su cui lavorare. Sicuramente occorre armarsi poi di un po’ di pazienza e prepararsi a ripetere il processo più volte per ottenere i risultati desiderati. Acquisita un po’ di pratica, il processo risulterà più facile.
-
2. Cambiare l’aspetto e la qualità delle immagini
valiantsin suprunovich / Shutterstock.com
Utilizzando il parametro “--aspect” o “--ar” è possibile modificare le proporzioni dell'immagine che verrà creata. Le proporzioni si riferiscono al rapporto tra larghezza e altezza di un'immagine e sono solitamente rappresentate come una coppia di numeri separati da due punti, come 7:4 o 4:3.
Il valore predefinito è 1:1 e --aspect accetta solo numeri interi (139:100 invece di 1.39:1)
Le più comuni sono:
- --aspect 1:1 Proporzioni predefinite
- --aspect 5:4 Frame comune e rapporto di stampa
- --aspect 3:2 Comune nella fotografia stampata
- --aspect 7:4 Vicino agli schermi TV HD e agli schermi degli smartphone
Esempio di prompt: /imagine prompt colorful narcissus --ar 5:4
Regolando il parametro “--quality” o “--q”, è possibile cambiare il tempo impiegato per generare un'immagine. Impostare una qualità dell’immagine superiore richiede più tempo di elaborazione, ma produce dettagli più complessi. Comunque, l'impostazione della qualità non influisce sulla risoluzione dell'output.
La qualità predefinita è 1, che rappresenta la qualità di base, ma è possibile impostarla su .25 (quarto di qualità) o .5 (metà qualità). Le impostazioni più alte non sono sempre migliori. A volte “less is more”: valori ridotti possono rendere le immagini astratte più belle, mentre valori più alti sono perfetti per dare luce ai dettagli di edifici e architetture.
Esempio di prompt: /imagine prompt detailed peony --q .25
Il parametro “--stylize” o "--s” influisce sull’intensità di colori, composizioni e forme artistiche. Un valore di stilizzazione basso genera immagini che assomigliano di più al prompt, mentre valori più alti producono immagini più artistiche e meno correlate al prompt. Il valore predefinito per la stilizzazione è "--s 100", ma si può impostare su qualsiasi valore compreso tra 0 e 1000.
Esempio di prompt: /imagine prompt illustrated strawberries --s 100
-
3. I parametri per il “controllo” creativo delle immagini
FrimuFilms / Shutterstock.com
Il parametro “--chaos” o “--c” ha un impatto sulla diversità delle griglie dell'immagine iniziale. Un alto valore di caos produce risultati più insoliti e imprevedibili, mentre valori di caos più bassi generano composizioni più coerenti e ripetibili. Si può specificare un valore di caos compreso tra 0 e 100 utilizzando il comando "--chaos", dove 0 è il valore predefinito e 50 è già un valore elevato.
Esempio di prompt: imagine/ prompt pineapple owl hybrid --c 10
Il parametro “--no” può essere utilizzato per eliminare particolari dettagli o imperfezioni dalle immagini generate. Ad esempio, l'utilizzo di “--no text” cerca di cancellare qualsiasi testo presente nell'immagine. Tuttavia, ciò potrebbe non produrre sempre il risultato desiderato.
Esempio di prompt: /imagine prompt exotic shorthair --no red-haired
Per interrompere un lavoro a metà dell'elaborazione, si può aggiungere il parametro “--stop” al prompt. Ciò produce un'immagine più morbida e meno dettagliata, il che a volte può servire. Ad esempio, aggiungere il parametro “--stop 50” al prompt pone fine al processo di generazione quando si trova al 50% del completamento. Ne risulta che l’immagine sarà piuttosto sfocata. --stop accetta valori: 10–100. Il valore predefinito è 100.
Esempio di prompt: /imagine prompt splatter art painting of almonds --stop 90
Il bot Midjourney utilizza un numero “--seed” o “--sameseed” per creare un campo di rumore visivo, come l'elettricità statica televisiva, come punto di partenza per generare le griglie dell'immagine iniziale. I “--seed” vengono generati casualmente per ogni immagine producendo un'ampia varietà di opzioni ogni volta che viene utilizzato un prompt. Ma possono essere specificati con numeri interi tra 0 e 429496729. L'utilizzo dello stesso numero di seme e prompt produrrà immagini finali simili.
Esempio di prompt: /imagine prompt eagle jug --seed 123
Per individuare il numero di --seed di una creazione presente su Discord, basta reagire con una emoji a forma di busta.
-
4. Creare motivi ripetuti ed esplorare le versioni di Midjourney
Il parametro “--tile” genera immagini che possono essere utilizzate come tessere ripetute per motivi continui come tessuti, sfondi e trame. Funziona con le versioni del modello 1, 2, 3 e 5 e genera solo una singola tessera. Occorre uno strumento per la creazione di modelli come Seamless Pattern Checker per la ripetizione.
Esempio prompt: /imagine prompt mandarin fish --v 5 --tile
Midjourney aggiorna frequentemente il modello per migliorare efficienza, coerenza e qualità. Quello più recente è il modello predefinito, ma è possibile utilizzarne altri (1, 2, 3, 4 e 5) specificando il numero dopo il parametro “--version” o “--v” oppure con il comando /settings selezionando una delle versioni.
Midjourney V5.1 o “--v 5.1” è il più recente e avanzato, ha un'estetica predefinita forte, che ne semplifica l'utilizzo con semplici prompt di testo. Molto coerente, eccelle nell'interpretazione accurata dei prompt in linguaggio naturale, produce meno artefatti e bordi indesiderati, ha una maggiore nitidezza dell'immagine e supporta funzionalità avanzate come la ripetizione di pattern.
Il modello Niji o “--niji 5” è nato dalla collaborazione tra Midjourney e Spellbrush per produrre anime e illustrazioni in stile giapponese. È ottimo da usare negli scatti dinamici e d'azione e nelle composizioni incentrate sul personaggio.
Esempio di prompt: /imagine prompt dalmatian playing --v 4
Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi