login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Bing Chat AI è in grado di capire anche le immagini

Ascolta l'articolo

Il tool di intelligenza artificiale generativa sfrutta lo stesso modello di linguaggio di ChatGPT, ma è il primo a proporre una funzionalità di analisi delle immagini.

Bing CryptoFX / Shutterstock.com

Bing Chat AI sembra essere la nuova intelligenza artificiale che va oltre i testi scritti e si dimostra in grado di “capire” anche le immagini

Da tempo anche Bing partecipa attivamente alla corsa ai tool di intelligenza artificiale generativa. Quegli strumenti tipo ChatGPT o Dall-E, che partono da una richiesta da parte dell’utente, per elaborare autonomamente contenuti inediti di vario genere. 

Ad oggi questo genere di intelligenze artificiali è stato utilizzato soprattutto per comprendere e interpretare richieste di natura scritta. Input che poi si traducono in output anche molto diversi tra loro: a partire dalla realizzazione di un articolo, un saggio o un racconto. Fino ad arrivare alla creazione di immagini, video o GIF animate

Le nuove funzionalità di Bing Chat AI provano a spostare il fuoco dal prodotto finito alla prima fase di richiesta. Più precisamente Microsoft sta implementando il suo tool in modo che sia capace di comprendere anche un input sotto forma di immagine

L’azienda fondata da Bill Gates ha reso noto che la nuova funzionalità in questione si chiamerà Visual Search. Il funzionamento sembra piuttosto intuitivo: l’utente inserisce un’immagine e Bing cerca di comprenderla al meglio delle sue possibilità. 

Come funziona la Visual Search di Bing AI

Microsoft ha diffuso un video dimostrativo che mostra il funzionamento della Visual Search di Bing Chat AI. La funzionalità analizza le immagini caricate, fino a inserirle nel proprio database. In questo modo ha modo di utilizzarle in risposte successive ove necessario. 

Le possibilità di Visual Search sembrano molteplici. Microsoft immagina ad esempio un utente in viaggio, interessato a saperne qualcosa di più sulle architetture o gli ambienti che lo circondano. Ebbene, con Bing AI non dovrebbe fare altro che scattare una foto a ciò che vede e “darla in pasto” all’intelligenza artificiale. 

Bing utilizzerà le conoscenze inserite nel proprio database, ma anche quelle presenti nel web, per elaborare una risposta il più completa possibile. E anche in questo caso le possibilità sono pressoché infinite. 

Nel caso sopracitato il tool di intelligenza artificiale generativa permette di spiegare all’utente che tipo di edificio ha di fronte. Ma in altri casi potrebbe aiutarlo a realizzare una ricetta in base alle materie prime presenti in una dispensa. Così come potrebbe suggerire una playlist in linea con dischi o vinili posizionati in uno scaffale. 

Da Google Lens a Bing AI

I sistemi di riconoscimento delle immagini sono ovviamente precedenti allo sviluppo dell’intelligenza artificiale generativa. Google Lens offre un servizio di questo tipo dal 2017. E il suo predecessore Google Goggles ha iniziato le attività addirittura nel 2010. 

La novità di Microsoft Bing AI sta nell’utilizzare le funzionalità di rilevamento delle immagini di GPT-4: il modello di linguaggio che viene utilizzato da tool quali ChatGPT. Con il paradosso che, ad oggi, proprio ChatGPT non include ancora una funzione di questo genere

Il risultato è che sottoponendo una qualunque immagine a Visual Search di Bing si ottengono risposte molto più complete rispetto a quelle di Google Lens. Le descrizioni testuali dell’AI sono talmente approfondite da rilevare i dettagli più piccoli: ad esempio potrebbero tenere conto del colore di un oggetto o di un accessorio di dimensioni irrisorie rispetto al complesso dell’immagine. 

Per saperne di piùIntelligenza Artificiale: cos'è e cosa può fare per noi

A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
TecnologicaMente
Sei un Multitasking Master o un Procrastinatore Pro?
Immagine principale del blocco
Sei un Multitasking Master o un Procrastinatore Pro?
Fda gratis svg
Fai il test sulle abitudini di lavoro e studio con la tecnologia
Fai il test gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.