Adesso ChatGPT accetta anche richieste vocali e immagini

Ascolta l'articolo

Sarà possibile attivare ChatGPT non solo digitando prompt in una casella di testo, ma parlando ad alta voce o semplicemente caricando un'immagine

utente consulta intelligenza artificiale

Laurence Dutton/iStock

mettiti alla prova con il quiz di mr. Plus su ChatGPT cos'è

LinkedIn X Facebook WhatsApp Email

Crea una playlist
Condividi l'articolo

LinkedIn X Facebook WhatsApp Email

Mentre la maggior parte dei cambiamenti che OpenAI ha apportato a ChatGPThanno riguardato ciò che il bot di intelligenza artificiale generativa poteva fare, ora il focus è sulla modalità di interazione con l’essere umano.

La società è pronta a lanciare una nuova versione di ChatGPT, per consentire agli utenti di conversare con l’AI non solo per mezzo di prompt inseriti nella casella di testo, ma tramite comandi vocali oppure caricando un’immagine.

Queste interessanti funzionalità verranno rese disponibili agli abbonati ChatGPT nelle prossime settimane e a tutti gli altri poco dopo, secondo quanto rivelato dalla società. Tuttavia, è essenziale bilanciare l’innovazione con un uso responsabile per garantire che questi potenti strumenti costituiscano un vantaggio piuttosto che un danno.

Comandi vocali: un'esperienza familiare ma migliorata

L'introduzione dei comandi vocali avvicina ChatGPT agli assistenti virtuali come Amazon Alexa e Google Assistant. Ora gli utenti potranno semplicemente toccare un pulsante e pronunciare la propria domanda. ChatGPT convertirà prontamente le parole in testo, elaborerà la query utilizzando il modello linguistico di grandi dimensioni sottostante, e una volta ottenuta la risposta, la pronuncerà ad alta voce.

OpenAI nutre grandi speranze che questa nuova funzione non solo renda l’interazione più fluida, ma fornisca anche risposte più accurate e approfondite, grazie ai miglioramenti tecnologici sottostanti. Tanto che la maggior parte degli assistenti vocali sembra si stia sottoponendo ad una revisione per fare affidamento sui LLM.

Fastweb Mobile Full

10,95€/mese

Internet 200 GB e Minuti illimitati

Spedizione SIM GRATIS

scopri

In questa corsa, la società è in prima linea con il modello Whisper che gestisce la conversione speech-to-text. Inoltre, sta lanciando un nuovo modello di sintesi vocale all’avanguardia, promettendo di generare audio molto simili al parlato umano da brevi frammenti di contenuto parlato.

Questo progresso suggerisce un futuro entusiasmante per le voci sintetiche, con potenziali applicazioni in campi come la traduzione di podcast in più lingue preservando le qualità tonali uniche della voce del podcaster originale. Che è quello che OpenAI sta facendo con Spotify.

Tuttavia, si apre un vaso di Pandora di potenziali usi impropri. OpenAI lo riconosce e sottolinea i rischi che ne derivano, inclusa la possibilità che attori malevoli possano impersonare personaggi pubblici o perpetrare frodi.

In risposta a queste preoccupazioni, prevede di adottare un approccio misurato limitando la disponibilità del modello, garantendo che rimanga entro confini rigorosi, limitato a casi d’uso e partnership specifiche.

La ricerca di immagini arriva su ChatGPT

La funzionalità di ricerca immagini in ChatGPT assomiglia a Google Lens, offrendo agli utenti la possibilità di scattare una foto di un oggetto o di una scena e ricevere informazioni pertinenti in risposta.

Nel caso di ChatGPT, si può migliorare le domande utilizzando lo strumento di disegno dell'app o accompagnando l'immagine con richieste parlate o digitate. Ciò che distingue questa funzionalità dal noto servizio di Big G è la natura interattiva del chatbot di OpenAI, che consente agli utenti il “botta e risposta”.

Tuttavia, l’uso della ricerca di immagini presenta potenziali sfide, soprattutto quando si ha a che fare con immagini di individui. OpenAI afferma di aver deliberatamente limitato la capacità di ChatGPT di analizzare e fare dichiarazioni dirette sulle persone.

Questa decisione è guidata da preoccupazioni in termini di accuratezza e privacy, e mira a garantire che l’intelligenza artificiale non invada i confini personali.

Bilanciare il progresso con la responsabilità

Quasi un anno dopo il debutto di ChatGPT, OpenAI continua la sua ricerca per migliorare le funzionalità e le capacità del bot, procedendo con cautela per evitare di introdurre problemi e sfide impreviste.

Anche questi ultimi aggiornamenti, l’azienda ha adottato un approccio misurato, ponendo intenzionalmente limitazioni alle capacità dei suoi nuovi modelli. Tuttavia, è evidente che questo approccio può essere solo una soluzione temporanea.

Con la crescita dell’adozione del controllo vocale e della ricerca di immagini e con l’evoluzione di ChatGPT in un vero assistente virtuale multimodale, il compito di mantenere i confini etici diventa sempre più complesso. La sfida sta nel trovare il delicato equilibrio tra innovazione e implementazione responsabile.

Per saperne di più: ChatGPT, cos'è, come funziona, a cosa serve, come usarla gratis

A cura di Cultur-e

Topic:

ChatGPT cos'è

#CuriositaTech

#DigitalDevelopment

#NuoveTecnologie

Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.

Fda

L'IA nel mondo del lavoro

L'IA nel mondo del lavoro

Impatti, sfide e opportunità

Iscriviti al corso gratuito

LinkedIn X Facebook WhatsApp Email

ChatGPT ora ricorda tutto ciò che dici, come cambiano le interazioni

ChatGPT diventa sempre più efficace poiché ora è in grado di ricordare tutto ciò che gli viene detto. Scopriamo come cambiano le interazioni con questa novità

Dev & Security

Perché Open AI vuole acquistare Google Chrome

Nel corso del processo antitrust ai danni di Google, una delle ipotesi è la vendita di Chrome. OpenAI coglie la palla al balzo e punta a comprare il browser

Dev & Security

Claude segue un codice etico, lo svela una ricerca di Anthropic

Anthropic ha analizzato oltre 700 mila conversazioni e ha individuato un codice etico seguito dalla sua intelligenza artificiale, Claude: tutti i dettagli

Scopri i corsi gratuiti della Fastweb Digital Academy

Agenti AI: cosa sono e come funzionano

Questo corso è progettato per introdurre i partecipanti al mondo degli Agenti AI, strumenti intelligenti capaci di supportare aziende e…

Introduzione agli NFT

Abbiamo sentito parlare degli NFT per merito delle famose scimmie milionarie, le Bored Apes, e per molti sono delle immagini con dei costi…

Introduzione alla programmazione in Python

Il Deep Learning è una tecnologia che comprende diverse discipline e le principali sono l’informatica e la programmazione. Il Deep Learning, infatti…