In Breve (TL;DR)
- DeepSeek-R1, il nuovo modello AI cinese, con capacità di ragionamento avanzate, offrendo risposte più accurate e pertinenti rispetto a molti LLM sul mercato.
- Il modello utilizza processi simile al ragionamento umano, riducendo le allucinazioni, ma con dei limiti su query sensibili, forse a causa della regolamentazione governativa cinese sull’AI.
- Accessibile tramite DeepSeek Chat, il tool promette versioni open source future, ampliando le opportunità di sviluppo e integrazione per la community AI.
DeepSeek, un’azienda cinese che lavora nel campo dell’intelligenza artificiale, ha rilasciato ufficialmente il suo nuovo modello AI con capacità di ragionamento chiamato DeepSeek-R1.
Stando alle prime dichiarazioni degli sviluppatori, si tratta di un modello estremamente performante che garantirebbe agli utenti modalità di ragionamento avanzate che sarebbero pari e forse superiori a quelle di ChatGPT o1, l’ultima versione del celebre chatbot di Open AI. Ecco cosa sappiamo.
Come funzionano le capacità di ragionamento di DeepSeek-R1
DeepSeek-R1 o meglio R1-Lite-Preview (dato che è ancora in fase di test), come tutti i modelli con capacità di ragionamento, ha la capacità, appunto, di ragionare più profondamente sui quesiti posti dagli utenti, riuscendo ad evitare tutte quelle allucinazioni che, generalmente, affliggono questo tipo di tecnologie.
In questo caso specifico ed esattamente a quanto avviene con ChatGPT o1, il tool lavora attraverso vari task, pianificando ogni sua mossa e compiendo tutta una serie di passi che lo portano a formulare una risposta.
In poche parole, è come se il tool dovesse “ragionare” per qualche secondo prima di dare una risposta, esattamente come fa il cervello umano.
Questo, chiaramente, può richiedere tempi operativi maggiori rispetto a un qualsiasi altro LLM, ma c’è la garanzia di una maggiore attendibilità e contenuti più precisi e pertinenti.
Come già anticipato, però, la vera particolarità di questo nuovo strumento è che ha prestazioni pari (e a volte superiori) alla ben più nota soluzione proposta da Open AI, questo almeno è quanto si può vedere dai primi benchmark AI provenienti da AIME e MATH (due strumenti che hanno il compito di valutare le prestazioni dei modelli AI).
Naturalmente, al pari di ChatGPT o1, anche questo modello non è perfetto e dai primi test effettuati si notano gli stessi problemi riscontrati con la controparte in alcuni ambiti, come tris ad esempio, o nella risoluzione di alcuni quesiti logici.
Oltre a questo sembra anche che DeepSeek-R1 vada a bloccare alcune query ritenute “troppo sensibili” come quelle sui temi politici.
Alcuni test effettuati, ad esempio, hanno mostrato che il modello si è rifiutato di rispondere a domande sul leader cinese Xi Jinping e su altre questioni riguardanti la politica del paese.
Questo comportamento potrebbe essere dovuto a una certa pressione del governo cinese sui progetti basati sull’intelligenza artificiale che devono essere tutti sottoposti a dei rigidi controlli da parte dell'autorità di regolamentazione di Internet prima di essere immessi sul mercato.
Oltretutto, sembra anche che il governo abbia imposto una “lista nera” di siti e fonti che non devono assolutamente essere utilizzate per l’addestramento dei modelli AI che, di conseguenza, si rifiutano di “dire la propria” su determinate questioni.
Come provare DeepSeek-R1
R1-Lite-Preview è accessibile tramite DeepSeek Chat andando su chat.deepseek.com e registrandosi al servizio.
Il tool è gratuito per l'uso pubblico ma la modalità avanzata Deep Think ha un limite giornaliero di 50 messaggi, pur offrendo comunque agli utenti la possibilità di provare le potenzialità di questo tool.
Secondo le dichiarazioni di DeepSeek, in futuro, c’è l’intenzione di rilasciare versioni open source dei vari modelli e delle relative API, così da renderle accessibili a tutta la comunità che lavora con gli strumenti AI e permettere loro di lavorare anche con modelli Deep Think avanzati come DeepSeek-R1.
Per saperne di più: ChatGPT, cos'è l'intelligenza artificiale generativa