login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Google Gemini, in arrivo la nuova funzione per ascoltare gli audio

Ascolta l'articolo

Google Gemini Pro 1.5 è ora in grado di ascoltare e comprendere i file audio caricati dagli utenti. La nuova funziona porta l’AI di Big G al livello successivo

Google Gemini mindea/Shutterstock

Lo sviluppo dell’intelligenza artificiale e delle funzioni ad essa connesse progredisce a un ritmo impressionante e non stupisce che nuove e straordinarie innovazioni vengano lanciate sul mercato quasi a cadenza quotidiana.

Tra i più prolifici in questo settore c’è, ovviamente, Google che sta apportando molte interessanti novità a Gemini 1.5 Pro, permettendo al modello di ascoltare i file audio caricati dagli utenti e di interagire con essi. Scopriamo di più al riguardo.

Le nuove funzioni per l’audio di Google Gemini

I vari chatbot AI sul mercato sono in grado di ricevere e comprendere input testuali, immagini oppure video e questo già è possibile da diverso tempo.

Gemini Pro, però, sta andando oltre e con le nuove funzionalità, come appena detto, sarà in grado di “ascoltare” i contenuti audio condivisi dagli utenti, con la possibilità di estrarre informazioni da essi.

Stando alle prime indicazioni condivise proprio da Big G, la nuova versione di Gemini 1.5 Pro è in grado di elaborare fino a un milione di token (pari a circa 11 ore di audio), partendo ovviamente dall’analisi dei file audio.

A fronte di questo, il colosso della tecnologia non ha esitato a definire questo cambiamento come un “aggiornamento sostanziale rispetto alle precedenti versioni”, che porta il tool di Big G al livello successivo, rendendo il “conflitto” con la concorrenza, come ChatGPT e Copilot, ancora più acceso.

Comunque, Gemini è in grado di “districarsi” con diversi tipi di audio, dalle registrazioni e fino ad arrivare alle trasmissioni radiofoniche, con la possibilità di comprendere le informazioni in essi contenuti e, al bisogno, di elaborare l’audio in diverse lingue, traducendo i file in tempo reale.

A onor del vero, però, le funzioni di traduttore mostrano ancora qualche leggera imprecisione, questo almeno è quello che dicono i risultati dei primi test effettuati.

Nonostante questo, però, Google conta di risolvere queste mancanze coi prossimi aggiornamenti, rendendo il chatbot ancora più performante.

Come provare le nuove funzioni di Gemini

Al momento l’anteprima pubblica delle nuove funzioni di Google Gemini Pro sono già disponibili su Vertex AI e sono a disposizione dei tester che vogliono provare le potenzialità del tool di Big G.

Anche se in totale silenzio, sembra che il colosso di Mountain View fosse a lavoro su queste novità già dallo scorso febbraio, coinvolgendo nell’impresa un ridotto numero di sviluppatori e alcuni clienti aziendali selezionati.

Dalle dichiarazioni a disposizione, sembra che già dalla fase di testing il tutto funzioni al meglio, portando sin da subito a ottimi risultati, al netto delle imprecisioni di cui sopra.

A fronte di questo, Google ha deciso di rendere la funzione disponibile agli utenti che già stanno “snocciolando” al massimo le potenzialità dell’AI, dimostrandosi estremamente soddisfatti.

Per saperne di più: Google Gemini, cos'è come funziona e come utilizzarla

A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
Whatsapp
Segui le ultime notizie sul nostro canale Whatsapp
Immagine principale del blocco
Segui le ultime notizie sul nostro canale Whatsapp
Fda gratis svg
Iscriviti al canale gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.