Nei giorni scorsi Google ha effettuato la presentazione ufficiale di Gemini AI, il primo sistema di Intelligenza Artificiale creato dall’azienda che promette di intervenire su diversi tipologie di informazioni e di contenuti, come immagini, video, audio e tanto altro ancora, e di essere compatibile con un gran numero di dispositivi differenti, tra cui gli smartphone.
Il lancio, tuttavia, non è stato privo di perplessità e di polemiche. In particolare, non sono passati inosservati alcuni dettagli di un video mostrato durante la presentazione. Si tratta di un contenuto di circa sei minuti in cui sono state mostrate le capacità multimodali di Gemini. A sollevare il dubbio è stata la testata Bloomberg, che ha affermato che le capacità di Gemini mostrate nel contenuto sembrano essere elevate, ma poco credibili. È arrivata immediatamente la risposta di Google, che suona come un’ammissione di colpe.
Google, i dubbi dopo il video di presentazione
Nel video di lancio Google ha messo in luce le capacità impressionanti di Gemini. Tra le altre cose, nel contenuto viene dimostrato come il sistema è in grado di effettuare a voce delle descrizioni di alcuni disegni, mettendone in luce dettagli e particolarità.
Nella descrizione del video di YouTube, piattaforma sulla quale è stato pubblicato il contenuto, è stato inserito un avviso: “Ai fini di questa demo, la latenza e gli output di Gemini sono stati ridotti per brevità”. Disclaimer non mostrato in nessun’altra parte all’interno del video stesso e che, secondo Bloomberg, sarebbe ben lontano dalla realtà.
Gemini è quindi apparso come un sistema basato sull’intelligenza artificiale perfettamente in grado di interagire in maniera naturale e fluida con il mondo circostante, rispondendo agli stimoli rapidamente e coerentemente.
La risposta di Google alle polemiche è un’ammissione: le riprese non erano in tempo reale
Dopo aver sottoposto il video ad accertamenti, Google ha confermato alla testata che la demo non è frutto di riprese in tempo reale con l’utilizzo di suggerimenti vocali, ma è il risultato dell’accorpamento di immagini fisse provenienti da un girato iniziale, in cui Gemini rispondeva a suggerimenti e messaggi di testo, successivamente editato.
Lo scopo del video, hanno affermato i vertici di Google alla CNBC, era puramente illustrativo e voleva solo far vedere al pubblico le future possibilità di interazione e di esperienza dell’utente. Se senza l’annuncio Gemini sembrava capace di rispondere in maniera fluida, ma dopo il chiarimento di Google, reso necessario dalle critiche, ora viene ipotizzata la presenza di alcuni limiti.
La reale forza di Gemini e la sua capacità di competere con sistemi avanzati di Intelligenza Artificiale, tra cui ChatGPT di OpenAi, a questo punto, sarà comprensibile solo dopo i primi test da parte degli utenti, che potranno metterne in luce potenzialità, punti di debolezza e migliorie da effettuare.
Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi