Nelle ultime settimane si sta sentendo sempre più parlare di un nuovo sistema pensato per imparare a dialogare con l’intelligenza artificiale; si tratta di un gioco interattivo, sviluppato da Google, che insegna all’utente a realizzare prompt efficaci.
Parliamo di Say what you see e, in effetti, rappresenta un approccio molto intuitivo per affacciarsi al mondo dell’interazione tra essere umano e AI generativa.
L’utente visualizza delle immagini e deve provare a descriverle nella maniera più dettagliata possibile. Conclusa l’operazione, può leggere il prompt realmente utilizzato con cui era stato chiesto a un’intelligenza artificiale di realizzare proprio l’immagine in questione.
Say what you see è il gioco di Google imparare a scrivere prompt
Say what you see (traducibile in italiano come “Dì cosa vedi”) è un gioco piuttosto intuitivo, che si pone l’obiettivo di avvicinare gli utenti senza competenze informatiche al mondo dei prompt.
Il termine prompt viene utilizzato per indicare quei testi scritti dall’essere umano per interagire con l’intelligenza artificiale generativa. Si pensi in tal senso alle classiche richieste che vengono inviate a chatbot tipo quello di ChatGPT.
Il gioco Say what you see è sviluppato a livelli e per procedere è necessario ottenere un punteggio minimo.
Molto semplicemente il sistema propone un’immagine e chiede all’utente di descriverla, il giocatore, dunque, deve letteralmente “dire cosa vede”, traducendo la percezione di un’immagine in testo. Un procedimento molto simile a quello che porta ad inviare richieste scritte ai tool di intelligenza artificiale generativa.
Come si gioca a Say what you see
Say what you see è pensato per premiare l’attenzione dell’utente e la sua capacità di restituire in forma ordinata il maggior numero possibile di particolari.
Per fare un esempio concreto è possibile citare l’immagine utilizzata per il primo livello di gioco: una foto che rappresenta un delizioso piatto di ramen.
La schermata è divisa in due parti: la foto è disposta sul lato sinistro, mentre sul lato destro appare una casella vuota, in cui va inserita la descrizione testuale di ciò che si sta osservando.
Scrivendo come risposta “un piatto di ramen” si supera il livello. Ma non si ottiene il massimo punteggio possibile. Il prompt corretto infatti è molto più dettagliato ed è traducibile in questo modo: “Una foto close up di una bowl di ramen con uova e cipolla tagliata ad anelli”.
Procedendo di livello in livello la sfida si fa sempre più complicata. E il raffronto tra le risposte dell’utente e i prompt originali aiuta a imparare le strategie più efficaci per comunicare in maniera corretta con un’intelligenza artificiale generativa.
Say what you see è soltanto l’ultimo investimento fatto da Google a sostegno dello sviluppo dell’AI. Il Colosso di Mountain View continua infatti a lavorare al chatbot sperimentale Google Bard. E parallelamente prosegue lo sviluppo della famiglia di LLM Gemini.
Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi