login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Cos'è e come funziona Google Gemini AI

Ascolta l'articolo

Cosa c’è da sapere su Google Gemini AI, la nuova intelligenza artificiale di Google. Dal set di dati con cui è stata addestrata, alle applicazioni future

gemini ai di google rafapress / Shutterstock.com

Google Gemini AI è la nuova intelligenza artificiale di Google. Un tool che, già in fase di test, sembra offrire risposte sensibilmente superiori rispetto alla concorrenza. E che è potenzialmente in grado di rivoluzionare l’esperienza utente in Internet

Google Gemini AI è un modello multimodale, con capacità di comprensione degli input mai viste prima. Soprattutto nel caso in cui venga chiamato a interpretare una fonte multimediale, come ad esempio un video

Le sue reali possibilità sono ancora tutte da scoprire, ma i primi test stanno offrendo risultati davvero impressionanti. Sia in termini di confronto con altre AI e con l’essere umano. Sia in termini di possibilità e ambiti di utilizzo

Cos’è Google Gemini AI e come funziona

gemini ai di google

rafapress / Shutterstock.com

Google Gemini AI è il nuovo tool di intelligenza artificiale generativa che punta a sbaragliare la concorrenza di ChatGPT. Anzi, stando a Google, Gemini ha già superato il GPT-4 sviluppato da OpenAI

La nuova intelligenza artificiale Google è in grado di comprendere diverse tipologie di input: a partire dal testo, fino ad arrivare alle immagini, gli audio e i video. Senza dimenticare l’inserimento di codice e tutta una serie di nuovi “sensi” che, stando a fonti interne, sono in via di sviluppo. 

Una caratteristica distintiva di Google Gemini AI è la sua natura multimodale da zero. Questo vuol dire che il set di dati con cui il tool è stato addestrato non si limita al testo, ma contiene anche altri media

Questo presupposto ha contribuito alla realizzazione di una comprensione molto più fluida e completa. Le altre AI generative ragionano innanzitutto in termini testuali. Anche nel momento in cui ricevono un video, un audio o un’immagine come input. 

Google Gemini AI è un’intelligenza artificiale multimodale in via di sviluppo, che ha già superato le prestazioni del GPT-4 di OpenAI. 

La nuova intelligenza artificiale Google al contrario riesce davvero a capire una fonte multimediale. E i video promozionali che la mostrano in azione sono semplicemente sbalorditivi. 

In rete è possibile trovare dei primi esperimenti di Google Gemini AI in azione. In uno di questi uno sviluppatore chiede al tool di descrivere delle azioni riprese da una telecamera. E l’intelligenza artificiale segue tutto in tempo reale, dando una testimonianza decisamente in linea con quella di un essere umano. 

A ciò si aggiungono i primi risultati ottenuti sottoponendo Google Gemini AI al cosiddetto test MMLU, dedicato al massive multitask language understanding. E anche in questo caso la risposta dell’AI va al di là di ogni aspettativa. 

Per la prima volta nella storia infatti un modello ha superato l’essere umano, oltre che il sopracitato GPT-4, in varie attività legate a comprensione, conoscenza e risoluzione di problemi

L’intelligenza artificiale Google è stata messa alla prova su oltre 50 materie: dalla storia alla medicina, dalla matematica all’etica, passando per la fisica e il diritto. Ottenendo un punteggio finale dell’89,8% di risposte esatte. 

Le potenzialità della nuova intelligenza artificiale Google

gemini ai su mobile

MeSSrro / Shutterstock.com

Google Gemini AI è tutt’ora in via di sviluppo. E uno dei primi obiettivi dichiarati dai suoi sviluppatori è l’integrazione con i prossimi smartphone Google Pixel

L’idea è che Gemini sfrutti al massimo le sue stupefacenti capacità di comprensione. In modo da riuscire ad aiutare l’utente nelle principali attività quotidiane

Ma le possibili applicazioni di questa AI generativa vanno ben oltre la sfera dell’ordinario. In un altro video dimostrativo alcuni scienziati mostrano Google Gemini mentre genera un codice inedito

Uno strumento grazie a cui il tool riesce innanzitutto a leggere e interpretare circa 200.000 documenti scientifici. Dopodiché il materiale viene catalogato e filtrato in base a diversi criteri di rilevanza. Infine gli studi di cui sopra diventano la base da cui partire per creare contenuti inediti: vere e proprie forme di meta-conoscenza.

Restando in tema codice, la nuova intelligenza artificiale Google è già in grado di “parlare” i principali linguaggi di programmazione: da Python a Java, passando per C++ e Go

Google Gemini AI parla i principali linguaggi di programmazione ed è in grado di generare interfacce utente che si codificano dinamicamente.

E anche in questo caso le prime dimostrazioni pratiche mostrano possibilità d’uso rivoluzionarie. Google Gemini AI infatti è in grado di sviluppare siti e interfacce utente che si codificano dinamicamente. Ciò vuol dire pagine e contenuti che cambiano aspetto in tempo reale, in base alle necessità dell’utente che le visita. 

In un test pubblicato da Google, Gemini accompagna un utente nella realizzazione di una landing page dedicata alla festa di compleanno di una bambina

L’AI riceve alcune istruzioni generiche sugli interessi della festeggiata e immediatamente propone dei template a tema. Senza che venga inserito alcun tipo di codice. 

Ma non solo. Una volta chiariti alcuni piccoli dubbi, Gemini propone autonomamente dei temi attorno a cui costruire la festa vera e propria. Aggiungendo giochi, attività e persino proposte di catering

Verso Gemini Ultra e Gemini Pro

schermata di google gemini ai

DIA TV / Shutterstock.com

Stando a fonti Google, Gemini AI verrà rilasciato in tre diverse dimensioni di modello. La prima dovrebbe chiamarsi Gemini Nano e nasce per l’installazione diretta su dispositivi mobile come smartphone e tablet

La seconda è attualmente nota col nome di Gemini Pro e andrà a sfidare direttamente il GPT 3.5 di OpenAI. Infine Gemini Ultra, il modello attualmente in fase di test, che ha di gran lunga superato i risultati del GPT-4.

Gemini Nano è già disponibile per gli smartphone Pixel 8 e Pixel 8 Pro. E Google ha annunciato che a breve verrà implementato su altri dispositivi Android

Gemini Pro può essere testato gratuitamente online attraverso Google Bard, utilizzando un account Google. Anche se, ad oggi, la versione disponibile è fortemente limitata. 

Infine Gemini Ultra potrebbe essere disponibile al pubblico entro il 2024. Ma prima della release ufficiale sarà necessario eseguire controlli approfonditi: sia in merito all’allineamento dei modelli, sia per arginare eventuali rischi di sicurezza informatica.

Per saperne di più:  Intelligenza Artificiale: cos'è e cosa può fare per noi

A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
TecnologicaMente
Sei un Multitasking Master o un Procrastinatore Pro?
Immagine principale del blocco
Sei un Multitasking Master o un Procrastinatore Pro?
Fda gratis svg
Fai il test sulle abitudini di lavoro e studio con la tecnologia
Fai il test gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.