IBM ha annunciato ufficialmente l’arrivo dei suoi nuovi modelli AI, quelli della famiglia Granite 3.0, i più avanzati fino a questo momento.
L’obiettivo dell’azienda è quello di portare sul mercato un LLM performante ed efficiente, pronto ad eguagliare e superare gli strumenti simili della concorrenza, garantendo trasparenza e un elevato standard di sicurezza. Ecco quello che sappiamo.
Granite 3.0 di IBM, come funzionano i nuovi modelli AI
La famiglia dei modelli Granite 3.0 si divide in tre rami, con ognuno di esso che fa riferimento a un utilizzo specifico.
Ci sono i modelli per l’uso generale o per il linguaggio che comprendono Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base e Granite 3.0 2B Base.
Quelli per la sicurezza con Granite Guardian 3.0 8B e Granite Guardian 3.0 2B
E quelli destinati agli sviluppatori e agli esperti del settore con Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base e Granite 3.0 1B-A400M Base.
Molto interessante la modalità di addestramento di questo LLM che prende in considerazioni grandissime quantità di dati aziendali, al contrario di quanto accade con altri modelli linguistici di grandi dimensioni che, invece, considerano solo i dati disponibili al pubblico.
I modelli Granite 3.0, infatti, sono stati addestrati su più di 12 trilioni di token che fanno riferimento a dati presi da 12 diversi linguaggi naturali e 116 diversi linguaggi di programmazione, utilizzando un nuovo metodo di addestramento in due fasi, sfruttando i risultati di migliaia di esperimenti progettati per ottimizzare la qualità dei dati e garantire parametri di addestramento precisi.
In termini di prestazioni, stando ai benchmark accademici di Hugging Face's OpenLLM Leaderboard, le prestazioni del modello Granite 3.0 8B Instruct superano mediamente quelle dei modelli open source più conosciuti sul mercato come quelli di Meta e Mistral.
A questo si aggiunge anche la garanzia di trasparenza, sicurezza con l’azienda che fornisce agli utenti un modello con funzione di rilevamento dei rischi, comprensione della fondatezza dei dati, del contesto e della risposta. A questo si aggiungono anche la comprensione dei rischi più comuni come i pregiudizi sociali, l’odio, la tossicità, la violenza e così via.
Come provare i nuovi modelli di IBM
I nuovi modelli della famiglia Granite di IBM sono già disponibili per il download su Hugging Face con licenza Apache 2.0.
Granite Guardian 3.0 8B e Granite Guardian 3.0 2B sono disponibili anche per l’utilizzo commerciale tramite Watsonx, l’apposita piattaforma sviluppata da IBM.
Una selezione dei vari modelli Granite 3.0 sarà disponibile anche sui microservizi NIM di NVIDIA e su Vertex AI Model Garden di Google Cloud.
Infine le funzionalità del codice dei modelli Granite sono disponibili anche per gli sviluppatori tramite l'estensione Visual Studio Code (IBM Granite.Code) utilizzabili anche con i diversi linguaggi di programmazione sul mercato come: C, C++, Go, Java e Python.
Per saperne di più:Intelligenza Artificiale: cos'è e cosa può fare per noi