Immagine in evidenza di Mika Baumeister su Unsplash
Era nata da appena una trentina di giorni; aveva solo tre dipendenti e un sito web, nessuna tecnologia da provare, nessuna metrica da mostrare negli elevator pitch, le brevi presentazioni con cui si cerca di raccogliere fondi dagli investitori. Difficile per chiunque ottenere denaro e fiducia in queste condizioni, anche nel munifico mondo delle startup tecnologiche, sensibile alle mode del momento e malato di Fomo, Fear of missing out, la paura di perdersi la prossima Google o Facebook che spinge i capitalisti di ventura a piazzare un obolo quasi ovunque.
Mistral, l’ambizione di diventare l’OpenAI europea
Eppure, nonostante il curriculum scarno, a giugno 2023 Mistral AI, neonata startup francese, è riuscita a raccogliere ben 105 milioni di euro in un round di finanziamento a un solo mese dalla nascita. Secondo Dealroom, piattaforma che monitora gli investimenti in innovazione, si tratta di un record continentale. I fondatori Timothee Lacroix, Guillaume Lample e Arthur Mensch hanno un passato in grandi società impegnate nell’intelligenza artificiale, da Google a Meta, e sono nomi rispettati nell’ambiente. Ma non basta.
Dietro alla rapida ascesa dell’azienda parigina appare chiara la volontà del Governo transalpino di creare un pezzo da novanta con cui prendere parte alla competizione per i Large Language Models (i modelli linguistici di grandi dimensioni). Del piano fa parte anche la difesa della lingua francese, orgoglio nazionale, che rischia di essere marginalizzata dal fatto che gli LLM più diffusi vengono addestrati da società anglosassoni su dataset in inglese. E l’idioma, per l’Eliseo, è da sempre strumento di diplomazia culturale e soft power, impiegato a piene mani per addolcire una politica estera pragmatica quando non proprio cinica. Pugno di ferro in guanto di velluto.
Funzionerà? Recuperare terreno sarà difficile per il Vecchio Continente e la Francia, rimasti indietro rispetto a concorrenti statunitensi e cinesi (abbiamo raccontato lo scenario globale della sfida sull’AI in questo articolo). La corsa alla AI generativa scatenata nel novembre 2022 dal rilascio di ChatGPT ha reso manifesta la portata del ritardo: oltre a OpenAI (cui fa capo ChatGPT; l’azienda è sostenuta da un investimento multimiliardario di Microsoft), nel business sono già entrate anche Google (con il suo Bard) e Meta di Mark Zuckerberg. Le altre Big Tech stanno scaldando i motori.
Ma, data l’importanza della partita, non è possibile rassegnarsi. Ed è necessario fare in fretta; per questo serve tutto il peso di un governo capace di aprire porte, favorire relazioni e investimenti, preparare il terreno a livello di legislazione europea, come quello francese.
“L’esecutivo ci sta mettendo la volontà politica”, commenta a Guerre di Rete Agata Hidalgo, responsabile per gli affari europei di France Digitale, associazione transalpina di startup e investitori. “Inoltre, per il continente è importante creare delle alternative europee ai big provider basati principalmente negli Stati Uniti. Credo che questa spinta sia parte di uno sforzo più ampio da parte dell’Europa per disporre di una serie di tecnologie proprietarie: abbiamo già visto prima con le piattaforme e poi con il cloud computing quanto sia grande la dipendenza da soluzioni e infrastrutture sviluppate e basate negli USA. L’ambizione di Mistral – conclude la dirigente – è di essere la OpenAI europea”.
Mistral, chi c’è dietro al campione francese dell’AI
Torniamo a Mistral. Il primo, mastodontico “giro” di finanziamento della società parigina (valutata 260 milioni di euro a giugno 2023) è stato guidato dal venture capital americano Lightspeed Ventures.
Tra gli altri investitori, però, troviamo alcuni nomi noti. Come Xavier Niel, imprenditore transalpino e fondatore, azionista di riferimento e presidente della compagnia telefonica Iliad. Non solo; Niel è co-proprietario del quotidiano Le Monde – l’intelligenza artificiale avrà un impatto rilevante sull’editoria, e metterci un piede dentro può essere utile per capire quale – e proprietario dell’incubatore, Station F, che si definisce “il più grande campus di startup al mondo”, con sede nel 13mo arrondissement in un’ex stazione ferroviaria.
Niel è molto attivo sul tema. Nei mesi scorsi ha annunciato un investimento da duecento milioni in intelligenza artificiale. L’obiettivo, afferma, è lavorare per cercare di mantenere la sovranità digitale in Francia. In particolare, Iliad ha dichiarato a settembre di aver acquistato un supercomputer Nvidia Dgx Super POD, definito “il più potente supercomputer cloud native per l’AI al momento in Europa”. La compagnia telefonica ha anche annunciato la creazione di un laboratorio di eccellenza a Parigi dedicato alla AI, nel quale sono già stati investiti cento milioni di euro.
Non solo. Proprio in questi giorni, 17 novembre, Station F ospiterà Ai Pulse, la “prima conferenza sull’intelligenza artificiale in Europa”, con una cinquantina di attori chiave del settore a prendervi parte. L’evento è organizzato in collaborazione con Scaleway, società francese di cloud computing e web hosting fondata nel 1999 sempre da Niel e controllata da Iliad. Oltre a lui, tra i relatori ci sarà Jensen Huang, fondatore e amministratore delegato di Nvidia, storico nome statunitense dei processori, salito alla ribalta nell’ultimo anno per l’importanza dei suoi componenti nelle tecnologie legate all’AI generativa.
“Abbiamo davvero bisogno – ha dichiarato Niel – […]che i nostri dati non vadano altrove, così che la AI non dipenda da algoritmi che non sono stati creati qui e che non sono europei”. E ha proseguito: “Per i nostri figli, non vogliamo avere algoritmi basati su [tecnologia dei] nostri amici americani e cinesi. Sono fantastici, ma forse non abbiamo le stesse regole e non seguiamo le stesse pratiche. Vogliamo che i nostri algoritmi seguano le nostre, di regole, con i nostri metodi operativi”.
Nella cordata che ha finanziato Mistral AI lo scorso giugno, stando a quanto ricostruito da Dealroom e Tech.eu, ci sono anche la società di pubblicità francese JCDecaux (l’advertising è un altro settore in cui l’AI avrà un impatto dirompente, con la possibilità di personalizzare gli annunci a livello impensabili fino a dodici mesi fa) e l’ex amministratore delegato di Google Eric Schmidt. C’è anche un pezzo di Italia (si fa per dire, dal momento che è basata in Olanda): tra gli investitori risulta infatti anche Exor Ventures, il fondo di venture capital della holding della famiglia Agnelli-Elkann, molto attiva sul versante dell’innovazione (nei giorni scorsi ha annunciato di aver investito altri 15 milioni in Phase V, società israeliana che ottimizza gli studi clinici per i farmaci).
Nomi grossi, compagini scafate che, probabilmente, non si sarebbero lasciate coinvolgere nel progetto di Mistral basandosi semplicemente sul curriculum – per quanto eccellente – dei fondatori. Mancava qualcosa, e il quid sono proprio i buoni uffici dell’Eliseo, un’assicurazione sulla vita per un’azienda giovane che si trova a competere in un mercato popolato da squali miliardari, con entrature in politica e lobbisti piazzati nelle principali capitali mondiali, da Washington a Bruxelles.
Macron, la grandeur e la sovranità digitale
Qualche giorno dopo l’annuncio del buon esito dell’operazione di raccolta fondi, Arthur Mensch, cofondatore e AD di Mistral, è salito sul palco di VivaTech, fiera parigina dedicata all’innovazione supportata dall’Eliseo, per una conversazione assieme ad altri ospiti. La stella è stata monsieur le President in persona, Emmanuele Macron, capace di parlare a braccio per un’ora di temi su cui la maggior parte dei politici si limita a ripetere leggendo brogliacci preparati da collaboratori più informati.
Parigi ha una propria strategia per l’intelligenza artificiale dal 2017, ma è corsa ai ripari dopo il rilascio di ChatGPT e recentemente ha aggiornato il documento. Così si esprimeva Macron a giugno dal palco della manifestazione che fotografa l’ecosistema transalpino dell’innovazione: “Dobbiamo creare un database francese per l’intelligenza artificiale” ha detto. “Altrimenti – ha proseguito – ci troveremo a usare modelli che presenteranno le distorsioni ereditate dagli anglosassoni”.
L’inquilino dell’Eliseo ha sostenuto che l’uso della lingua francese nella AI sia un problema di sovranità e un tema di soft power culturale, illustrando l’idea di “aprire” i database, e di appoggiare un approccio open source come quello di Mistral. La stessa Mistral parla di un “oligopolio AI emergente” (qui) – un riferimento a quello delle società americane. Ma cosa significa “open source” nel campo dell’intelligenza artificiale?
Open source o no?
Macron, come detto, e Mistral sostengono di puntare al modello open source e non proprietario di intelligenza artificiale. Cosa significa lo spiega a Guerre di Rete Fabrizio Silvestri, professore di Deep Learning al dipartimento di Ingegneria informatica, automatica e gestionale dell’università La Sapienza di Roma. “Open in informatica ha diverse accezioni”, commenta lo studioso. “Nell’ambito dei Large Language Models significa che sia il codice sorgente, sia i dati su cui i modelli sono stati addestrati, sia i ‘pesi’ (cioè i parametri, ndr) sono aperti e disponibili a tutti”.
I pesi sono i parametri che il modello apprende durante il training e che servono per predire il token successivo in una sequenza e quindi il testo generato (per una spiegazione più tecnica vedi qua).
“L’importanza di conoscere i dati su cui il modello è addestrato è sintetizzato dalla regola aurea garbage in, garbage out”, prosegue Silvestri. “Dalla qualità dell’input, cioè, dipende la qualità dell’output”.
Dal 27 settembre è disponibile per il download il primo modello di Mistral, il 7B. Si tratta di un modello più “piccolo” rispetto a quelli di OpenAI e Google, ma che secondo l’azienda è in grado di fornire prestazioni superiori a quelli della sua categoria. Nei ringraziamenti di Mistral compare anche il Cineca, consorzio interuniversitario italiano con sede a Bologna, dove si trova anche il supercomputer Leonardo, che ha fornito potenza di calcolo.
Ma è davvero open source?
“La cosa più importante [di Mistral] – scrive al riguardo il sito Techcrunch – è che il modello è stato rilasciato sotto licenza Apache 2.0, una licenza molto permissiva, che non prevede restrizioni per l’uso e la riproduzione oltre l’attribuzione. Questo significa che il modello può essere usato da un appassionato, da una società da miliardi di dollari o dal Pentagono alla stessa maniera, a condizione che siano dotati di un sistema in grado di farlo girare localmente o vogliano pagare per le risorse necessarie in cloud”.
Il magazine però poco sotto aggiusta il tiro: vero, sostiene, la licenza è molto permissiva, ma il modello è stato pur sempre sviluppato da una società privata, usando capitali privati, e i dataset e i “pesi” restano di proprietà privata tanto quanto quelli dei concorrenti americani.
Secondo il giornalista Devin Coldeweym, che è riuscito a parlare con Arthur Mensch, l’AD di Mistral AI, parliamo quindi di una società essenzialmente profit. “La versione free del modello sarà liberamente utilizzabile, ma chi vorrà fare sul serio vorrà il prodotto a pagamento”, afferma il cronista. “[L’offerta commerciale] sarà costruita come soluzione white box, mettendo a disposizione pesi e codice – scrive al riguardo Mistral – Stiamo lavorando su hosted solutions e sviluppi dedicati all’impresa”.
Non tutti i prodotti di Mistral verranno rilasciati sotto licenza Apache 2.0, ha confermato Mensch a Coldeweym: solo alcuni lo saranno. “Versioni large del modello saranno rilasciate tramite API, probabilmente a pagamento”, riprende ancora Techcrunch, “invece che con un approccio DIY (Do it yourself). [Mensch] ha rifiutato di fornire maggiori dettagli sull’addestramento e il processo di assemblaggio di dataset, dicendo che fino a questo momento sono proprietari”.
Dettagli, forse, ma fare ordine, al di là degli annunci e del marketing, è operazione meritevole. Nella guerra della AI generativa la parola open sta suscitando scontri intensi. OpenAI di Sam Altman ce l’ha ancora nel brand, nonostante sia poco più di un ricordo degli inizi.
Guerre di Rete ha provato a contattare Mistral, che sul sito non ha una sezione per la stampa, e il suo amministratore delegato Arthur Mensch, in entrambi i casi senza ottenere risposta.
Le altre francesi impegnate nella AI
Mistral non è l’unica azienda francese di una certa dimensione impegnata nell’intelligenza artificiale. C’è anche LightOn, anch’essa citata da Macron tra i campioni d’Oltralpe del settore. Fondata nel 2016, e quindi con un passato alle spalle, la società è ancora molto attiva.
Gli ultimi sviluppi sono recenti: lo scorso 24 ottobre Docaposte (sussidiaria delle Poste francesi specializzata nella transizione digitale) ha annunciato l’uscita per novembre di una “soluzione di intelligenza artificiale generativa sovrana” assieme proprio a LightOn (che ci mette il modello linguistico), Aleia (piattaforma collaborativa specializzata in Ai) e NumSpot (un provider pubblico di servizi cloud “sovrano” e “affidabile”).
NumSpot è un consorzio tra Docaposte con La Banque des Territoires, Dassault Systèmes e Bouygues Telecom. Insomma, tutto in famiglia, tutto in Francia.
“Grazie a questa partnership di esperienze e capacità – scrive LightOn – Docaposte dimostra che c’è un’alternativa francese robusta e potente nell’intelligenza artificiale generativa, che offre sicurezza, confidenzialità, project isolation, tracciabilità, e garanzie sui dati e le loro modalità di utilizzo”.
Tra i language model transalpini c’è anche Camembert, che lo scorso maggio ha lanciato Camembert-bio, un modello linguistico biomedicale in francese. “I dati clinici negli ospedali sono sempre più accessibili per la ricerca attraverso i data warehouse sanitari”, scrivono i ricercatori impegnati nel progetto. “Tuttavia questi documenti non sono strutturati. È quindi necessario estrarre informazioni dai referti medici per poterli analizzare, e in questo l’AI può essere d’aiuto”.
“Il modello è stato addestrato usando […] un nuovo corpus biomedico francese pubblico da 413 milioni di parole […]. Contiene documenti scientifici, foglietti illustrativi di farmaci e casi clinici estratti da tesi e articoli”, ha dichiarato Rian Touchent, membro del team che ha lavorato a Camembert-bio.
Certo, la concorrenza delle big è difficile da battere. “Ultimamente, modelli generativi potenti hanno occasionalmente superato i modelli specializzati nei task biomedici”, ammettono gli scienziati coinvolti. “Crediamo, comunque, che i modelli di tipo BERT [ovvero i modelli di base o foundation models come la serie GPT e appunto BERT di Google, ndr] mantengano ancora un valore, in particolare per ambienti clinici caratterizzati dalla scarsità di risorse [economiche]. Inoltre, l’impiego di modelli generativi presenta sfide nel mantenere la confidenzialità dei documenti clinici dovute ai server remoti e all’accesso alle API”. Con la salute non si scherza, ed è meglio che i dati sanitari restino in casa.
La francofonia come strumento di soft power
Lo spaccato qui sopra mostra in maniera chiara quanto la Francia tenga a realizzare un modello linguistico sovrano, e che non si fermerà alle prime difficoltà. Del resto, Parigi piazza i padiglioni dell’Istituto per la francofonia in molti dei principali incontri internazionali, comprese le Cop, dove si parla di clima.
“In un momento in cui ci si torna a dividere, in cui riaffiora l’odio, in cui si vorrebbero opporre le comunità una contro l’altra, le religioni, le origini”, ha detto esplicitamente il presidente Macron il 31 ottobre, “la lingua francese è un cemento”. L’occasione è stata l’inaugurazione della Cité internationale de la langue française: un intero castello dedicato all’idioma transalpino a 45 minuti da Parigi.
Tra gli impieghi di una AI generativa nativamente in francese “anche quelli relativi alla moderazione dei contenuti, che otterrebbe in questo caso performance superiori”, conferma Hidalgo. Un tema di cui da anni si discute sempre più spesso.
Un LLM italiano: Dante
Anche l’Italia prova a gettarsi nella mischia, appoggiandosi ai cugini d’Oltralpe. Lo fa con Dante LLM, nome provvisorio di un Large Language Model basato su Mistral, realizzato dal gruppo di lavoro RSTLess di Silvestri e che sarà rilasciato nei prossimi mesi. Dante succede a Fauno, uscito poco dopo il blocco di ChatGPT in Italia da parte del Garante per la privacy: “Essenzialmente, si tratta di una versione migliorata di Fauno addestrata su molti più dati e task”, dice Silvestri. “Se Fauno era principalmente focalizzato sul question answering, Dante è stato addestrato su diversi task e molti più argomenti, tra cui virologia, religioni, sociologia, nutrizione, invecchiamento umano, diritto internazionale. E l’elenco è molto più lungo.”
I dataset utilizzati sono completamente pubblici. “Eticamente è un vantaggio, e abbiamo visto che la qualità dell’output non decrementa troppo”, riprende lo studioso. Che aggiunge: “La strada migliore da seguire, per me, sarebbe quella totalmente open source: si tratta di tecnologie utili a tutti e che dovrebbero essere patrimonio dell’umanità”. Certo, c’è anche il rovescio della medaglia: “Se restano nelle mani di pochi, potremmo controllare meglio cosa questi soggetti fanno, cosa che diventa molto più difficile quando il campo di allarga”. Un esempio? “Se un’organizzazione terroristica scaricasse Dante e facesse fine tuning per insegnargli a compiere attentati, nonostante le cautele, non è escluso che possa riuscirci”.
Se ne sono accorti anche i governi. Nei giorni scorsi, a margine del vertice londinese di Bletchley Park sull’intelligenza artificiale, il primo ministro britannico Rishi Sunak ha affermato che le AI dovranno essere controllate dalle spie di MI5 e MI6 per evitare usi malevoli. Sunak ha annunciato la firma di un accordo tra governi e le principali società coinvolte nello sviluppo per controllare i nuovi modelli prima che ne sia consentito l’utilizzo. Le aziende coinvolte sono Anthropic, Google, Google DeepMind, Amazon, Inflection AI, Meta, Microsoft, Mistral AI and Open AI; i governi Australia, Canada, Francia, Germania, Italia, Giappone, Corea del Sud, Singapore, Stati Uniti, Regno Unito, oltre all’Unione europea. Ma per un approfondimento sull’AI Safety Summit rimandiamo a questo numero della newsletter di Guerre di Rete.