Cos'è e come funziona Google Gemini AI

Ascolta l'articolo

Cosa c’è da sapere su Google Gemini AI, la nuova intelligenza artificiale di Google. Dal set di dati con cui è stata addestrata, alle applicazioni future

rafapress / Shutterstock.com

mettiti alla prova con il quiz di mr. Plus su Intelligenza Artificiale

LinkedIn X Facebook WhatsApp Email

Crea una playlist
Condividi l'articolo

LinkedIn X Facebook WhatsApp Email

Google Gemini AI è la nuova intelligenza artificiale di Google. Un tool che, già in fase di test, sembra offrire risposte sensibilmente superiori rispetto alla concorrenza. E che è potenzialmente in grado di rivoluzionare l’esperienza utente in Internet.

Google Gemini AI è un modello multimodale, con capacità di comprensione degli input mai viste prima. Soprattutto nel caso in cui venga chiamato a interpretare una fonte multimediale, come ad esempio un video.

Le sue reali possibilità sono ancora tutte da scoprire, ma i primi test stanno offrendo risultati davvero impressionanti. Sia in termini di confronto con altre AI e con l’essere umano. Sia in termini di possibilità e ambiti di utilizzo.

Cos’è Google Gemini AI e come funziona

gemini ai di google

rafapress / Shutterstock.com

Google Gemini AI è il nuovo tool di intelligenza artificiale generativa che punta a sbaragliare la concorrenza di ChatGPT. Anzi, stando a Google, Gemini ha già superato il GPT-4 sviluppato da OpenAI.

La nuova intelligenza artificiale Google è in grado di comprendere diverse tipologie di input: a partire dal testo, fino ad arrivare alle immagini, gli audio e i video. Senza dimenticare l’inserimento di codice e tutta una serie di nuovi “sensi” che, stando a fonti interne, sono in via di sviluppo.

Una caratteristica distintiva di Google Gemini AI è la sua natura multimodale da zero. Questo vuol dire che il set di dati con cui il tool è stato addestrato non si limita al testo, ma contiene anche altri media.

Questo presupposto ha contribuito alla realizzazione di una comprensione molto più fluida e completa. Le altre AI generative ragionano innanzitutto in termini testuali. Anche nel momento in cui ricevono un video, un audio o un’immagine come input.

Google Gemini AI è un’intelligenza artificiale multimodale in via di sviluppo, che ha già superato le prestazioni del GPT-4 di OpenAI.

La nuova intelligenza artificiale Google al contrario riesce davvero a capire una fonte multimediale. E i video promozionali che la mostrano in azione sono semplicemente sbalorditivi.

Fastweb Mobile Full

10,95€/mese

Internet 200 GB e Minuti illimitati

Spedizione SIM GRATIS

scopri

In rete è possibile trovare dei primi esperimenti di Google Gemini AI in azione. In uno di questi uno sviluppatore chiede al tool di descrivere delle azioni riprese da una telecamera. E l’intelligenza artificiale segue tutto in tempo reale, dando una testimonianza decisamente in linea con quella di un essere umano.

A ciò si aggiungono i primi risultati ottenuti sottoponendo Google Gemini AI al cosiddetto test MMLU, dedicato al massive multitask language understanding. E anche in questo caso la risposta dell’AI va al di là di ogni aspettativa.

Per la prima volta nella storia infatti un modello ha superato l’essere umano, oltre che il sopracitato GPT-4, in varie attività legate a comprensione, conoscenza e risoluzione di problemi.

L’intelligenza artificiale Google è stata messa alla prova su oltre 50 materie: dalla storia alla medicina, dalla matematica all’etica, passando per la fisica e il diritto. Ottenendo un punteggio finale dell’89,8% di risposte esatte.

Le potenzialità della nuova intelligenza artificiale Google

gemini ai su mobile

MeSSrro / Shutterstock.com

Google Gemini AI è tutt’ora in via di sviluppo. E uno dei primi obiettivi dichiarati dai suoi sviluppatori è l’integrazione con i prossimi smartphone Google Pixel.

L’idea è che Gemini sfrutti al massimo le sue stupefacenti capacità di comprensione. In modo da riuscire ad aiutare l’utente nelle principali attività quotidiane.

Ma le possibili applicazioni di questa AI generativa vanno ben oltre la sfera dell’ordinario. In un altro video dimostrativo alcuni scienziati mostrano Google Gemini mentre genera un codice inedito.

Uno strumento grazie a cui il tool riesce innanzitutto a leggere e interpretare circa 200.000 documenti scientifici. Dopodiché il materiale viene catalogato e filtrato in base a diversi criteri di rilevanza. Infine gli studi di cui sopra diventano la base da cui partire per creare contenuti inediti: vere e proprie forme di meta-conoscenza.

Restando in tema codice, la nuova intelligenza artificiale Google è già in grado di “parlare” i principali linguaggi di programmazione: da Python a Java, passando per C++ e Go.

Google Gemini AI parla i principali linguaggi di programmazione ed è in grado di generare interfacce utente che si codificano dinamicamente.

E anche in questo caso le prime dimostrazioni pratiche mostrano possibilità d’uso rivoluzionarie. Google Gemini AI infatti è in grado di sviluppare siti e interfacce utente che si codificano dinamicamente. Ciò vuol dire pagine e contenuti che cambiano aspetto in tempo reale, in base alle necessità dell’utente che le visita.

In un test pubblicato da Google, Gemini accompagna un utente nella realizzazione di una landing page dedicata alla festa di compleanno di una bambina.

L’AI riceve alcune istruzioni generiche sugli interessi della festeggiata e immediatamente propone dei template a tema. Senza che venga inserito alcun tipo di codice.

Ma non solo. Una volta chiariti alcuni piccoli dubbi, Gemini propone autonomamente dei temi attorno a cui costruire la festa vera e propria. Aggiungendo giochi, attività e persino proposte di catering.

Verso Gemini Ultra e Gemini Pro

DIA TV / Shutterstock.com

Stando a fonti Google, Gemini AI verrà rilasciato in tre diverse dimensioni di modello. La prima dovrebbe chiamarsi Gemini Nano e nasce per l’installazione diretta su dispositivi mobile come smartphone e tablet.

La seconda è attualmente nota col nome di Gemini Pro e andrà a sfidare direttamente il GPT 3.5 di OpenAI. Infine Gemini Ultra, il modello attualmente in fase di test, che ha di gran lunga superato i risultati del GPT-4.

Gemini Nano è già disponibile per gli smartphone Pixel 8 e Pixel 8 Pro. E Google ha annunciato che a breve verrà implementato su altri dispositivi Android.

Gemini Pro può essere testato gratuitamente online attraverso Google Bard, utilizzando un account Google. Anche se, ad oggi, la versione disponibile è fortemente limitata.

Infine Gemini Ultra potrebbe essere disponibile al pubblico entro il 2024. Ma prima della release ufficiale sarà necessario eseguire controlli approfonditi: sia in merito all’allineamento dei modelli, sia per arginare eventuali rischi di sicurezza informatica.

Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi

A cura di Cultur-e

Topic:

Intelligenza Artificiale

#CuriositaTech

#DigitalDevelopment

#NuoveTecnologie

Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.

Segui le ultime notizie sul nostro canale Whatsapp

Segui le ultime notizie sul nostro canale Whatsapp

Iscriviti al canale gratuito

LinkedIn X Facebook WhatsApp Email

Claude segue un codice etico, lo svela una ricerca di Anthropic

Anthropic ha analizzato oltre 700 mila conversazioni e ha individuato un codice etico seguito dalla sua intelligenza artificiale, Claude: tutti i dettagli

Dev & Security

iPhone 17e quando arriva

Secondo alcune indiscrezioni sul web Apple sarebbe già al lavoro sul prossimo iPhone 17e, confermando la volontà di aggiornamenti annuali anche per il low cost

Dev & Security

Come proteggere l’ID Apple in caso di attacco hacker

Come proteggere efficacemente il proprio ID Apple in caso di un attacco hacker. I consigli per tenere al sicuro i propri dati personali su iPhone, iPad e Mac

Scopri i corsi gratuiti della Fastweb Digital Academy

Agenti AI: cosa sono e come funzionano

Questo corso è progettato per introdurre i partecipanti al mondo degli Agenti AI, strumenti intelligenti capaci di supportare aziende e…

Introduzione agli NFT

Abbiamo sentito parlare degli NFT per merito delle famose scimmie milionarie, le Bored Apes, e per molti sono delle immagini con dei costi…

Introduzione alla programmazione in Python

Il Deep Learning è una tecnologia che comprende diverse discipline e le principali sono l’informatica e la programmazione. Il Deep Learning, infatti…