Immagine in evidenza: Bandiera cinese in città da Rawpixels, Creative Commons
“È una delle innovazioni più sorprendenti e impressionanti che abbia mai visto”: le parole del venture capitalist Marc Andreessen sintetizzano alla perfezione lo stupore con cui la Silicon Valley ha assistito all’avvento di V3 e R1, i modelli di intelligenza artificiale creati da DeepSeek, la startup cinese derivata dall’hedge fund di Lian Wenfeng.
DeepSeek è riuscita a creare sistemi di AI potenti almeno quanto i principali realizzati negli Stati Uniti a una frazione del costo di training – 5,6 milioni di dollari per il suo modello V3, un LLM (modello linguistico di grandi dimensioni), contro gli oltre 100 milioni stimati per ChatGPT-4 – e utilizzando chip molto meno potenti e probabilmente in quantità inferiore (il numero di schede Nvidia utilizzate è ancora dibattuto), anche a causa dei blocchi commerciali imposti dagli Stati Uniti. DeepSeek è riuscita nell’impresa usando delle tecniche di programmazione e di funzionamento innovative e procedendo a ottimizzazioni sistematiche e su larga scala nel funzionamento dei sistemi di creazione e gestione dei modelli.
In questo ha giocato un ruolo significativo anche il fatto che DeepSeek abbia scelto un modello di sviluppo di tipo open source (pur con le differenze che questo ha nel settore dell’intelligenza artificiale rispetto all’ingegneria del software tradizionale, tanto che la definizione di open per questi modelli è contestata), da un lato potendo sfruttare l’aiuto di sviluppatori indipendenti di tutto il mondo, dall’altro aumentando la pervasività dei suoi modelli, perché possono essere scaricati da chiunque, nel repository presente su GitHub, e utilizzati in altro modo. I modelli possono quindi essere utilizzati in locale anche con computer relativamente poco potenti, mentre altre aziende possono riutilizzarli dopo averli portati nel proprio cloud. Microsoft stessa ha dichiarato di voler aggiungere i modelli di DeepSeek nell’offerta del suo cloud Azure (nonostante la partnership con OpenAI), mentre Perplexity offre R1 come opzione per il suo motore di ricerca.
La scossa al modello americano
La stampa e i mercati finanziari hanno rapidamente registrato il cambiamento nel settore dell’intelligenza artificiale, comparando il lavoro e i costi affrontati da DeepSeek con quanto invece sostenuto dalle aziende statunitensi del settore, cioè che siano necessari investimenti di capitale e tecnologia crescenti per sviluppare nuovi modelli e mantenere la supremazia statunitense. Nel biennio 2023-2024 le cifre, mai rivelate ufficialmente, sono state nell’ordine di grandezza dei 100 milioni di dollari per l’addestramento dei modelli di nuova generazione, e questo contando solo il costo d’uso dei processori, mentre per il 2025, come aveva dichiarato l’anno scorso il Ceo di Anthropic Dario Amodei, la cifra necessaria per l’addestramento della “next gen” di AI potrebbe arrivare anche al miliardo di dollari.
La comparazione più facile per la stampa internazionale e per i mercati finanziari è stata comunque quella con lo “Stargate Project”, pianificato durante la presidenza di Joe Biden da OpenAI, SoftBank, Oracle e il fondo emiratino Mgx, e presentato alla Casa Bianca da Donald Trump il 21 gennaio. Il progetto prevede che, per continuare lo sviluppo dei modelli realizzati da OpenAI, sia necessario creare una gigantesca infrastruttura di centri di calcolo dedicata esclusivamente all’azienda di Sam Altman al costo iniziale di 100 miliardi di dollari nel 2025, che potrebbero diventare 500 miliardi in quattro anni, generando tra le altre cose più di 100mila posti di lavoro negli Usa. L’obiettivo, secondo Altman, è lo sviluppo dell’intelligenza artificiale generale (AGI), mentre per il presidente Trump è più esplicitamente il mantenimento della supremazia statunitense nel settore.
Durante un evento pubblico tenuto solo un giorno prima, il 20 gennaio, Liang Wenfeng ha presentato al premier cinese Li Qiang il modello di DeepSeek capace di “ragionamento”, R1, che secondo varie metriche è pari o superiore a o1 di OpenAI, il modello giudicato finora il più avanzato tra quelli dotati di ragionamento. Riferendosi alla presentazione di questo particolare modello, Marc Andreessen ha parlato del “momento Sputnik” dell’intelligenza artificiale, con un suggestivo riferimento alla messa in orbita nel 1954 da parte dei sovietici del primo satellite artificiale, che abbatté il primato americano nel settore aerospaziale e scatenò la corsa allo spazio, con la nascita della Nasa, l’espansione del programma militare e, indirettamente, la nascita di Internet.
L’impatto del “momento Sputnik” di DeepSeek per adesso si è tradotto invece in una reazione di shock e nel timore di un “AI Gap” evidenziato da tutte le più autorevoli testate internazionali, a partire da quelle statunitensi. I giornali hanno sostanzialmente ufficializzato lo stupore per questa “new entry” cinese, sconosciuta ai più, nel settore dell’intelligenza artificiale, che non solo è riuscita a raggiungere e superare il campione del settore (OpenAI), ma lo ha fatto mettendone in discussione gli assunti tecnologici ed economici.
Al di là dei dettagli tecnici (numero di parametri dei modelli di DeepSeek, modalità di addestramento e funzionamento, velocità e modalità di gestione dei token) ed economici (costo dell’addestramento e del funzionamento, costi di inferenza e costo delle GPU utilizzate), l’impatto del nuovo attore cinese ha prodotto un primo risultato immediato, cioè il crollo dei titoli delle aziende centrali per lo sviluppo dell’intelligenza artificiale, che dal 2022 stavano godendo di una crescita significativa. In particolare, Nvidia ha perso circa 600 miliardi di dollari in poche ore (-17%), ma il calo ha coinvolto, su cifre più contenute, anche gli altri protagonisti del settore: Alphabet/Google, Amazon, Meta e Microsoft (OpenAI non è quotata in Borsa).
DeepSeek ha scelto di rendere i suoi modelli V3 e R1 open source, adottando una licenza MIT che consente a chiunque di utilizzarli e modificarli liberamente. Tuttavia, l’azienda cinese, pur avendo reso open source diversi elementi dei suoi modelli V3 e R1, ha lasciato alcune limitazioni. Sebbene i pesi dei modelli siano stati resi disponibili (approccio “Open Weights”), il codice sorgente completo e i dati di addestramento non sono stati pubblicati. Di conseguenza, non è possibile ricreare completamente i modelli partendo da zero.
Secondo l’OSI (Open Source Initiative), l’AI Open Source è un sistema AI reso disponibile secondo termini che garantiscono la libertà di:
- utilizzarlo per qualsiasi scopo e senza dover chiedere il permesso; studiarne il funzionamento e ispezionare i suoi componenti
- modificarlo per qualsiasi scopo, anche per cambiare il suo output
- condividere il sistema affinché altri lo utilizzino con o senza modifiche, per qualsiasi scopo.
Il presupposto per esercitare queste libertà è avere accesso alla forma preferita per apportare modifiche al sistema, che deve includere:
- Informazioni sui dati (di training)
- Il codice sorgente utilizzato per addestrare ed eseguire il sistema
- I parametri del modello
DeepSeek è riuscita a rompere la narrazione, portata avanti da alcune aziende degli Stati Uniti, secondo la quale lo sviluppo dell’intelligenza artificiale richiede investimenti miliardari crescenti e l’aumento esponenziale di centri di calcolo per sviluppare nuovi sistemi di intelligenza artificiale. Ed è riuscita a rompere questa narrazione senza minarne la base, che sia cioè comunque opportuno, e anzi necessario, sviluppare l’intelligenza artificiale perché utile alle imprese e all’umanità in generale, rispetto invece alle resistenze (soprattutto occidentali) di chi vede nello sviluppo dell’intelligenza artificiale un pericolo per l’umanità diretto (una sorta di “rischio Terminator”) o indiretto (soprattutto per l’impatto ambientale dei centri di calcolo, ma anche dal punto di vista occupazionale e non solo).
L’AI come strumento di supremazia strategica
Inoltre, DeepSeek è (involontariamente) riuscita a far mettere a fuoco ai media, e a una parte dell’opinione pubblica occidentale, le dimensioni dello scontro in corso tra gli Stati Uniti e la Cina. La supremazia nell’ambito dell’intelligenza artificiale è un fattore non solo puramente tecnologico ed economico, ma anche strategico e geopolitico.
L’intelligenza artificiale (intesa in senso lato, non solo come AI generativa) è facilmente convertibile a fini bellici, sia in contesti di scontri convenzionali, sia non convenzionali e asimmetrici. Può infatti essere utilizzata sia per campagne di disinformazione, spam, hacking, furto di informazioni o più in generale di sabotaggio tecnologico, ma anche come strumento di intelligence per analisi di dati sia di natura riservata sia pubblica, oltre che come strumento militare diretto: dai droni a guida autonoma alle armi e bombe intelligenti, dai software per sistemi d’arma innovativi (compresi i robot) agli altri meccanismi automatici o semiautomatici da usare sul campo nei conflitti.
L’intelligenza artificiale è inoltre uno strumento in grado di aumentare l’innovazione in altri settori: dalla ricerca biochimica all’ambito finanziario.
La supremazia tecnologica degli Stati Uniti, nel campo dell’intelligenza artificiale come in altri settori, è un elemento della dottrina della deterrenza militare americana, che si stava già riorganizzando attorno al settore privato. Per esempio, Eric Schmidt, uno dei cofondatori di Sun Microsystems e poi Ceo di Google, da tre anni porta avanti un’attività di lobbying incentrata sull’idea che le forze armate statunitensi debbano modernizzarsi velocemente, sfruttando a questo scopo sistemi di intelligenza artificiale a qualsiasi livello (il cosiddetto “AI Warfare”), mentre Palantir Technologies, creata tra gli altri da Peter Thiel, uno degli ex soci di Elon Musk e personaggio strumentale per il successo elettorale di Donald Trump, ha numerosi appalti militari per la fornitura di sistemi di intelligence basati su AI.
Assieme all’impatto tecnologico, economico, finanziario e ambientale, l’intelligenza artificiale cinese realizzata da DeepSeek sta avendo un ruolo più sotterraneo, ma altrettanto dirompente, nei rapporti di forza geopolitici in generale.
Mostrando come, al di là dei blocchi e delle sanzioni americane, possa raggiungere e superare la tecnologia realizzata dagli Usa, con costi più accessibili e un impatto ambientale inferiore di vari ordini di grandezza, la storia di DeepSeek rimette in discussione uno dei vettori di crescita economica diretta apparentemente più consolidati, ovvero gli enormi e crescenti investimenti pianificati nel settore dello sviluppo e funzionamento dell’AI.
Inoltre, crea uno strumento che non solo solleva potenziali problemi di privacy (tanto che il Garante italiano ha subito chiesto chiarimenti e poi è intervenuto con una istruttoria), ma, in Occidente, può anche essere considerato un rischio per la sicurezza nazionale assimilabile a quello che gli Usa sostengono sia causato dal social media TikTok. Il riferimento è, da un lato, alla censura e manipolazione dei contenuti e delle risposte fornite dai modelli di DeepSeek (anche se limitazioni sulle risposte sono presenti nei modelli di tutte le aziende), dall’altro, all’estrazione di informazioni personali, prompt, chat e alla loro conservazione a tempo indeterminato su server cinesi, con possibili utilizzi anche a fini di intelligence (almeno nella versione che non prevede un utilizzo in locale, che limiterebbe molti di questi rischi).
È per queste ragioni che possiamo considerare l’intelligenza artificiale come un moltiplicatore di potenza strategico, che opera su tre livelli principali. Innanzitutto, su una dimensione economica, perché rappresenta una tecnologia abilitante fondamentale, paragonabile all’elettricità o al motore a combustione interna. Chi oggi domina lo sviluppo dell’AI avrà vantaggi competitivi enormi in molteplici settori.
Dal punto di vista militare – dove, come abbiamo visto, sta trasformando profondamente la natura dei conflitti moderni permettendo lo sviluppo di sistemi d’arma autonomi – l’intelligenza artificiale potenzia drasticamente le capacità di intelligence e sorveglianza, automatizzando in parte il processo decisionale sul campo di battaglia.
Dal punto di vista geopolitico, l’intelligenza artificiale rappresenta invece il fulcro di quella che è ormai diventata una specie di nuova “corsa agli armamenti tecnologici” tra gli Stati Uniti e la Cina. Controllare l’AI non determina solo la supremazia militare ed economica, ma anche la capacità di influenzare gli standard globali e le norme etiche del suo utilizzo.
La corsa all’intelligenza artificiale è quindi una competizione caratterizzata, da un lato, da una forte interdipendenza nelle catene di approvvigionamento tra i due paesi e, dall’altro, dalla mancanza quasi completa di una governance globale condivisa. Governance condivisa che, peraltro, esiste in quasi tutti gli altri settori di attrito tra stati o blocchi di stati. È proprio questo doppio vincolo, l’interdipendenza e la mancanza di governance globale condivisa, che dovrebbe far nascere le preoccupazioni maggiori.