La Cina sfida apertamente i giganti dell’AI

di


Normalmente non ci occupiamo direttamente di tecnologie e tool specifici, ma riteniamo che questa notizia meriti sicuramente un’eccezione. Deepseek, una delle più promettenti aziende cinesi nel campo dell’intelligenza artificiale, ha appena lanciato il suo nuovo modello Deepseek R1, e le implicazioni sono profonde sia dal punto di vista tecnologico che strategico.

Deepseek R1: un modello rivoluzionario

Deepseek R1 è un modello MoE (Mixture of Experts) con ben 671 miliardi di parametri, di cui 37 miliardi attivi in ogni specifica inferenza. Questo approccio lo rende estremamente potente per task complessi, garantendo al contempo un’ottimizzazione nell’uso delle risorse computazionali. Tra i suoi punti di forza emerge una straordinaria capacità di reasoning e di seguire complessi “Chain of Thoughts” (CoT), rendendolo ideale per applicazioni che richiedono logica sequenziale e analisi approfondita.

A differenza di molti modelli di punta, Deepseek R1 è stato rilasciato con pesi aperti (open weights) e sotto licenza MIT. Ciò significa che è liberamente utilizzabile anche per scopi commerciali, una scelta che potrebbe rivoluzionare il panorama dell’AI democratizzandone l’accesso.

La chat gratuita e le funzionalità avanzate

Deepseek R1 è già disponibile attraverso una chat gratuita su chat.deepseek.com, che include la funzione “DeepThink”. Quest’ultima consente agli utenti di sfruttare al massimo le capacità di reasoning del modello, rendendolo uno strumento pratico sia per privati che per aziende.

API economiche: una sfida diretta ai competitor

Deepseek ha introdotto un sistema di API a prezzi estremamente competitivi: $0,55 per milione di token in input e $2,19 per milione di token in output. Confrontando questi costi con quelli di OpenAI (GPT-o1), che attualmente richiedono $15 per milione di token in input e $60 per milione in output, la differenza è abissale. Questo potrebbe attirare una vasta platea di sviluppatori e aziende, che potrebbero migrare verso Deepseek per risparmiare sui costi operativi.

Modelli derivati: un ecosistema in espansione

Un altro elemento chiave è l’utilizzo dei dati sintetici generati da Deepseek R1 per distillare sei modelli più piccoli, basati su architetture Qwen e Llama, con dimensioni che vanno da 1,5 miliardi a 70 miliardi di parametri. Questi modelli derivati ampliano l’accessibilità, offrendo opzioni più leggere per chi non necessita delle massime prestazioni.

Prestazioni straordinarie

Abbiamo testato Deepseek R1 con un set di 13 domande che spaziavano dal reasoning al coding e ad altre sfide generiche. Il modello ha risposto correttamente a tutte, dimostrando un livello di competenza sorprendente, spesso in grado di competere con i migliori sistemi statunitensi.

Un cambiamento epocale

L’ingresso deciso della Cina in questo settore è una chiara sfida ai giganti statunitensi dell’AI. Offrendo strumenti gratuiti come la chat di Deepseek, la Cina sta sottilmente erodendo il mercato dominato da servizi a pagamento come Claude e ChatGPT, quest’ultimo con un abbonamento completo di $200 al mese.

Ma questa nuova competizione solleva anche interrogativi importanti: come influenzerà la gestione dei dati personali? E quale sarà l’impatto sulla privacy degli utenti, soprattutto considerando l’origine di questi strumenti?

Prospettive future

Nei prossimi 12 mesi possiamo aspettarci un’ulteriore accelerazione dello sviluppo di modelli open-source e servizi AI accessibili. Potrebbe nascere un nuovo equilibrio tra innovazione tecnologica e regolamentazione, con utenti e aziende chiamati a scegliere tra soluzioni a basso costo e quelle più consolidate.

Cosa ne pensate? Siete pronti a provare Deepseek R1 o ritenete che i rischi superino i vantaggi?