Da qualche tempo l’intelligenza artificiale ChatGPT, nella sua versione plus, ha lanciato una nuova interessantissima funzionalità: la possibilità di analizzare immagini caricate direttamente dall’utente.
Questo servizio apre a possibilità impensabili in passato: a partire dal riconoscimento delle piante a quello di qualsiasi altro soggetto sconosciuto all’utente.
Ma non finisce qui. ChatGPT è anche in grado di riconoscere e riposizionare le diverse informazioni presenti in un’immagine.
Un’altra funzione che apre a usi diversi: fare ordine tra i dati di un grafico troppo complesso. Identificare un libro “nascosto” all’interno di un mobile troppo pieno. Generare un testo che riposiziona una collezione di dischi in ordine alfabetico. E tanto altro ancora.
ChatGPT plus è addirittura in grado di diventare un potentissimo strumento di accessibilità. Basti pensare ai vantaggi disponibili per chiunque non abbia la possibilità di osservare un’immagine nei suoi dettagli più specifici.
A ciò si aggiunge un ulteriore filone di possibilità, a metà tra il filosofico e il tecnologico. L’analisi immagini di ChatGPT può infatti generare una specie di loop senza fine di contenuti multimediali ispirati dall’AI. A partire dai prompt per immagini, fino ad arrivare a nuovi testi ispirati dalla loro esecuzione.
-
1. Riconoscimento e comprensione di immagini con ChatGPT
Shutterstock
Un primo utilizzo delle nuove funzioni di analisi immagini ChatGPT è legato a una comprensione profonda dei contenuti multimediali caricati. Ciò vuol dire, ad esempio, riconoscimento di piante o animali sconosciuti.
Moltissimi utenti si divertono a scattare foto alla natura che li circonda. Ma non tutti sono effettivamente in grado di identificare la flora e la fauna immortalate.
Con ChatGPT plus è possibile ovviare a questo impedimento. Basta caricare la foto scattata e chiedere allo strumento di intelligenza artificiale di identificare quanto immortalato.
In tal senso ChatGPT offre almeno una funzione in più rispetto al suo “rivale” Google Lens. Il tool sembra infatti in grado di trarre informazioni ancora più precise attraverso l’analisi di gruppi di immagini simili tra loro. Si pensi in tal senso a diversi scatti che immortalano lo stesso soggetto da angolazioni e distanze diverse.
La capacità di comprensione delle foto di ChatGPT non si limita certamente ai ritratti. Non a caso alcuni utenti caricano sul software di OpenAI contenuti grafici: dalle diapositive ai diagrammi.
Lo scopo è chiedere al tool di analizzare le informazioni inserite al loro interno. O addirittura di aiutarli a comprenderle, esponendole in una forma più semplice e riassuntiva.
Da questo punto di vista l’esperienza con ChatGPT è già molto avanzata. Basta caricare un grafico di qualsiasi genere e poi iniziare a fare domande mirate sui contenuti riportati al suo interno.
Attenzione però a non sopravvalutare l’intelligenza artificiale. In questo momento storico ChatGPT commette ancora diversi errori, come la stragrande maggioranza dei suoi competitor.
Dunque è consigliabile prendere con le molle determinate operazioni analitiche realizzate dal tool. O per lo meno sottoporle a una conferma empirica tornando sul grafico e i dati in questione.
-
2. Usare ChatGPT come uno strumento di accessibilità
Shutterstock
Grazie alla nuova funzione di analisi delle immagini, ChatGPT è in grado di sbloccare molteplici servizi all’insegna dell’ordinamento di informazioni.
Per fare un esempio concreto: è possibile scattare una foto a un mobile e chiedere all’intelligenza artificiale di generare un elenco ordinato dei titoli al suo interno. Così come è possibile creare più elenchi in base al formato: libri da una parte, vinili dall’altra e così via.
Gli utenti più fantasiosi hanno addirittura provato a chiedere a ChatGPT di aiutarli a trovare un’opera di cui avevano dimenticato la posizione, con risultati sorprendenti.
Questa versatilità di utilizzo apre le porte a modalità inedite di interazione tra essere umano e intelligenza artificiale. Una piccola, grande rivoluzione, che potrebbe trasformare ChatGPT in uno strumento di accessibilità straordinario.
Si pensi in tal senso a un utente con problemi di vista, che potrebbe chiedere aiuto all’AI per recuperare informazioni preziose. Ma anche alla possibilità di scrivere automaticamente meta description e testi alternativi, utili a descrivere le immagini a chiunque non sia in grado di guardarle.
In questi casi l’utente non dovrebbe fare altro che caricare l’immagine in questione, lasciando che ChatGPT la analizzi. E poi chiedere al tool di generare una descrizione testuale esaustiva.
-
3. Come generare nuovi prompt per immagini con ChatGPT
Shutterstock
Un altro aspetto di ChatGPT potrebbe presto venire rivoluzionato è la possibilità di creare prompt per immagini. Partendo proprio dalle funzionalità di analisi descritte nei capoversi precedenti.
L’input di immagini del tool può infatti essere utilizzato anche per chiedere all’AI di realizzare un nuovo prompt ChatGPT: un ordine che chiede all’intelligenza artificiale generativa di eseguire una qualsiasi attività. E che in questo caso sarebbe basato proprio sull’immagine caricata.
In altre parole: l’analisi e la descrizione di una qualsiasi immagine, realizzate con ChatGPT, possono trasformarsi in un punto di partenza. Una base per creare nuovi contenuti inediti testuali, in base alle necessità del singolo utente.
La creazione di prompt a partire dalle immagini dà il La a un flusso potenzialmente infinito. Le nuove immagini create con ChatGPT possono infatti diventare a loro volta origine di qualcos’altro. Ad esempio possono dare l’ispirazione al tool per scrivere nuovi testi.
Questo tipo di processo è molto più facile di quanto non si potrebbe immaginare e non richiede alcun tipo di conoscenza avanzata di prompt engineering.
L’utente non deve fare altro che caricare un’immagine su ChatGPT e chiedere al tool di utilizzarla come base di partenza per creare qualcosa di nuovo.
Dopodiché deve prendere la nuova immagine generare e utilizzarla nuovamente come punto di partenza: ad esempio per scrivere il testo di una canzone, piuttosto che un racconto breve.
Per saperne di più: ChatGPT, cos'è, come funziona, a cosa serve, come usarla gratis