L’IA Generativa
Nel panorama in continua evoluzione dell'intelligenza artificiale, un nuovo campo sta emergendo con forza: l'intelligenza artificiale generativa. Diversamente dall'intelligenza artificiale tradizionale, che si concentra sull'analisi e la comprensione di dati esistenti, l'intelligenza artificiale generativa ha la capacità di creare contenuti nuovi e originali, come testi, immagini, musica e persino codice.
Al centro di questo processo rivoluzionario si trova il Prompt Engineering, l'arte di formulare istruzioni precise e dettagliate che guidano l'intelligenza artificiale generativa nella creazione di contenuti in linea con le nostre aspettative.
L'intelligenza artificiale generativa ha fatto notevoli progressi negli ultimi anni e sta rivoluzionando diversi aspetti della nostra vita. È una sottoarea dell'intelligenza artificiale che sfrutta algoritmi complessi, come le reti neurali profonde, per "imparare" da grandi quantità di dati esistenti, ed utilizzare questa conoscenza per generare nuovi contenuti originali, misurati in token.
Ma cos’è un token?
Un token rappresenta un’unità elementare del linguaggio, che compone un prompt, ovvero l'istruzione che guida l'intelligenza artificiale nella creazione di contenuti.
Bisogna pensare ai token come a dei mattoni che costruiscono una frase. Ogni token rappresenta una parola, una punteggiatura o un simbolo speciale, e la loro sequenza determina il significato complessivo del prompt. L'intelligenza artificiale analizza i token del prompt e li utilizza come base per generare un testo, un'immagine, un brano musicale o qualsiasi altro tipo di contenuto in linea con le istruzioni fornite.
Facciamo un esempio pratico per comprendere meglio la differenza tra una parola ed un token. La parola "grattacielo" in italiano è appunto un’unica parola, ma essa si può scomporre in due token “gratta” e “cielo”. Questa suddivisione aiuta il modello ad elaborare l’input e fornire un output.
I token rappresentano quindi un elemento fondamentale dell'intelligenza artificiale generativa, fungendo da ponte tra le nostre istruzioni e la capacità dell'intelligenza artificiale di creare contenuti originali.
Il Prompt Engineering, una definizione
Il Prompt Engineering è il processo di creazione di istruzioni chiare e concise che comunicano all'intelligenza artificiale generativa cosa vogliamo che essa crei. Queste istruzioni, definite prompt, fungono da guida per l'intelligenza artificiale e le forniscono le informazioni necessarie per generare contenuti di alta qualità.
Immagine generata con DALL-E da Federica Ruberto
0-shot learning vs Multimodal prompting
All'interno del Prompt Engineering, si possono distinguere alcune tecniche:
- 0-shot learning: in questo approccio, l'intelligenza artificiale non necessita di alcun addestramento specifico in merito al compito da svolgere. Fornendole un prompt ben strutturato, l'IA sarà in grado di generare contenuti pertinenti, basandosi sulle sue sole conoscenze generali del linguaggio e del mondo, senza necessità di fornire esempi specifici dell’attività che si desidera che essa svolga.
- Few-shot learning: si distingue dallo 0-shot per l'utilizzo di un numero limitato di esempi per guidare l'intelligenza artificiale. In questo approccio, si forniscono all'intelligenza artificiale alcuni esempi del tipo di contenuto desiderato, insieme ad un prompt che descrive le caratteristiche specifiche che dovrebbe possedere il nuovo contenuto.
- Multimodal prompting: questa tecnica combina prompt testuali con altri tipi di dati, come immagini, audio o video, per fornire all'intelligenza artificiale un contesto più ricco e sfumato. Ciò consente di ottenere risultati più creativi ed accurati, soprattutto in compiti complessi come la generazione di descrizioni di immagini o la creazione di storie.
Prompting: le 4 T
Quando gli esseri umani comunicano tra loro, danno per scontato il contesto non verbale in cui sono immersi, ad esempio il loro lavoro, la loro cultura o la posizione geografica in cui essi vivono. Per creare prompt accurati invece, è necessario fornire agli LLM (Large Language Models) un contesto il più possibile specifico.
Stock photo and footage / iStock via Getty Images
Ecco perché per creare il prompt ideale dovremmo seguire la strategia delle 4T.
- Tratti: si indica all’IA il ruolo che deve impersonare per pensare e rispondere alle domande su determinati argomenti. Ad esempio si può chiedere all’IA di agire come un esperto di social media marketing: “Sei un esperto di social media marketing con oltre dieci anni di esperienza nel settore degli elettrodomestici”.
- Task: si indica all’IA l’attività da svolgere, sia essa la redazione di un’e-mail, di un articolo di giornale, la creazione di un’immagine, o altro. Anche in questo caso bisogna essere il più specifici possibile. Ad esempio si può chiedere: “Aiutami a scrivere un post per il social media LinkedIn, in cui presenti questa persona come ospite di un podcast che tratta di intelligenza artificiale”.
- Tono: il tono indica all’intelligenza artificiale che deve scrivere seguendo uno stile specifico o un determinato “Tone of voice”. Pensiamo ad esempio al caso in cui chiediamo all’IA di redigere per noi un’e-mail. Potremmo in questo caso, utilizzando la metodologia Few-shot vista in precedenza, aggiungere alcuni esempi di e-mail create da noi e chiedere all’intelligenza artificiale di impersonarci, copiando il nostro stesso stile.
- Target: identifica qual è il pubblico di riferimento. Ad esempio, ci si sta rivolgendo ad un gruppo di studenti universitari, o ad un gruppo di esperti programmatori e programmatrici nella fascia d’età 35-50 anni.
La strategia delle 4T può essere implementata dando anche ulteriori indicazioni all’IA affinchè il prompt sia ancor più efficace.
Suchat longthara / iStock via Getty Images
Nell’elaborazione di una formula matematica ad esempio si può dire all’intelligenza artificiale che, prima di dare la sua risposta, deve procedere facendo un ragionamento “step by step” ("passo dopo passo"). Il ragionamento “step by step”, può aiutarci a comprendere meglio i passaggi che l’IA ha fatto per arrivare alla soluzione di un’equazione, o più genericamente, i passaggi compiuti nel suo ragionamento per giungere alla risposta fornita.
Oppure si può specificare, nella creazione di un nuovo articolo per un blog, che l’IA debba tener conto della lunghezza minima di 1500 caratteri comprensivi di spazi. Questa indicazione non sempre è seguita alla lettera dall’intelligenza artificiale, quindi bisogna tener conto di eventuali imprecisioni senza prendere per oro colato quanto fornito dall’IA .
O ancora, che nell’elaborazione della sua risposta essa non devii dall’argomento principale, che il contenuto sia appropriato, chiaro, e che rispetti determinati principi etici.
Una regola fondamentale quando si parla di IA Generativa è quella non solo di verificare sempre l’output per assicurarsi che sia corretto e che non incorra in allucinazioni (ovvero quando il modello inventa le risposte a causa di un prompt scadente), ma anche di tenere a mente che le IA sono portatrici di bias, infatti molti di questi modelli sono stati addestrati su set di dati che contengono pregiudizi umani, quindi attenzione!
Immagine generata con DALL-E da Federica Ruberto
Prompt Engineering, considerazioni finali
Il Prompt Engineering rappresenta un passo avanti significativo nel rapporto tra esseri umani ed intelligenza artificiale. Come abbiamo visto in questo articolo, attraverso la formulazione di prompt efficaci, possiamo sbloccare il potenziale creativo dell'intelligenza artificiale generativa ed utilizzarla per realizzare una vasta gamma di applicazioni, dalla creazione di contenuti multimediali all'automazione di compiti complessi, ma dobbiamo sempre tenere a mente le limitazioni che derivano da pregiudizi umani, addestramenti scorretti, indicazioni fuorvianti, o formulazioni di risposte imprecise.
L’IA è un validissimo strumento che ci viene in aiuto nel lavoro e nelle attività quotidiane, ma non può sostituirsi completamente alla revisione attenta di un umano. Deve essere vista come un suggerimento da cui trarre spunto o da cui partire per l’elaborazione di contenuti originali e verificati e che, grazie alle semplici regole applicate al prompt viste sin qui, può dare dei risultati sempre più in linea con quanto atteso.