Skip to content Skip to footer

Creare insieme o contro l’algoritmo?

Andrea De Santis da Usplash

Immagine in evidenza: foto di Andrea De Santis da Unsplash

ChatGPT, DALL-E, Bard, Stable Diffusion, Midjourney: le intelligenze artificiali generative, in grado di creare testi, immagini, video e suoni a partire dagli input degli utenti, hanno investito trasversalmente ogni settore produttivo, creativo e di ricerca che lavora con informazioni, dati ed elementi d’archivio. Nel corso di pochissimi mesi, i prodotti basati sui modelli linguistici di grandi dimensioni (LLM, Large Language Models) hanno raggiunto centinaia di milioni di persone: chi semplicemente per provarli, chi per studiarli, chi per farsi affiancare nel proprio lavoro quotidiano – fino al punto di farsi (quasi) sostituire.

Tecnologie capaci di penetrare così rapidamente negli immaginari e nella quotidianità del grande pubblico finiscono per produrre dibattiti che si polarizzano altrettanto velocemente, tra tecno-ottimisti convinti che la diffusione di questi algoritmi rivoluzionerà completamente la civiltà umana, e chi invece teme che una diffusione incontrollata di strumenti ancora così acerbi non potrà fare altro che amplificare dinamiche di disuguaglianza, ingiustizia e discriminazione di cui gli algoritmi implentati dalle piattaforme digitali si erano già dimostrati catalizzatori.

Ma quella in corso non è una trasformazione esclusivamente strumentale: l’introduzione di questi algoritmi nell’immaginario del grande pubblico sta mutando il nostro modo di percepire il ruolo delle intelligenze artificiali nella nostra vita. Se i settori lavorativi evolvono da sempre di pari passo con le innovazioni tecnologiche, diverso è il discorso per il mondo creativo e artistico, il quale, nonostante le numerose rivoluzioni affrontate, ha sempre mantenuto il ruolo dell’artista umano al centro.

L’impatto degli algoritmi nel mondo dell’arte e della creatività

Potremmo dibattere per ore sull’effettiva utilità di questi algoritmi nello svolgimento di compiti quotidiani, ma non vi è dubbio che i risultati più pirotecnici siano stati elaborati applicando questi algoritmi al mondo dell’arte e della creatività.

Dal lancio delle prime versioni di DALL-E e Stable Diffusion, capaci di produrre immagini quantomeno verosimili a partire da prompt testuali, fino ai risultati fotorealistici generati dall’ultima versione di Midjourney (e che preoccupano per la loro capacità di produrre contenuti facilmente scambiabili per fotografie reali), l’impatto che i Large Language Model stanno avendo su una disciplina profondamente umana come la creatività sta lasciando artisti, creativi e appassionati incuriositi, disorientati e spesso preoccupati.

Per capire il perché di questa preoccupazione, è necessario fare il punto sulle potenzialità e i limiti di questi strumenti. Per esempio, le intelligenze artificiali generative permettono di accelerare i processi creativi di brainstorming, traducendo in tempi rapidi un panorama immaginativo umano in un contenuto visivo o testuale. O ancora, se non si ha la pretesa di produrre risultati accurati, le intelligenze artificiali generative testuali permettono di raccogliere rapidamente informazioni altamente specifiche, da cui partire per un eventuale lavoro di ricerca.

Il motivo per cui tantissimi stanno guardando a questa tecnologia con preoccupazione è lo stesso che si cela dietro alle sue potenzialità: questo tipo di intelligenze artificiali operano dopo essersi addestrate su ampi dataset di informazioni. Ci sono dataset che raccolgono testi di ogni tipo (come Common Crawl, usato fra gli altri per ChatGPT), e altri curati con un taglio più specifico (come LAION-5B o suoi subset, usati per Midjourney e Stable Diffusion, che abbinano immagini e descrizioni testuali).

La preoccupazione principale riguarda i contenuti presenti all’interno di questi dataset, che spesso raccolgono testi e immagini disseminati liberamente per Internet, anche quando sono protetti da proprietà intellettuale, e che sono recuperati senza il consenso esplicito degli autori. È il caso, per esempio, di Greg Rutkwoski, un artista digitale polacco dallo stile particolarmente riconoscibile, che ha scoperto di essere straordinariamente popolare tra gli utenti degli algoritmi text-to-image —al punto da trovare su Internet opere attribuite a lui, facilmente confondibili con degli originali, ma che lui non aveva mai creato. È il caso, anche, dell’illustratrice Hollie Mengert, che si è ritrovata protagonista di un modello appositamente sviluppato per imitare il suo stile di disegno.

Il 13 gennaio 2023, un gruppo di artisti affiancati da avvocati specializzati in class action, ha fatto causa a Stability AI, Midjourney e DeviantArt per l’utilizzo di algoritmi addestrati su dataset contenenti opere artistiche senza il consenso degli autori.

I possibili impatti, però, non si fermano alle violazioni del diritto d’autore. Se questi algoritmi sono in grado di generare immagini ispirandosi allo stile di artisti specifici grazie a dataset che raccolgono anche le loro opere, allora chiunque li usi può generare autonomamente contenuti visivi in grado, quantomeno, di passare per originali. Le implicazioni, in questo senso, sono evidenti in termini di economia del lavoro. Io ci sono passato personalmente: all’inizio dell’anno ho aggiornato e rilanciato il mio blog personale e per un periodo ho presentato ogni post con un’immagine di copertina generata con Midjourney, come nel caso di questo articolo.

Queste immagini, diffuse attraverso i principali social network, risultavano credibili ed esteticamente coerenti con ciò che un lettore si potrebbe aspettare di vedere nella copertina di un post su un blog. Ho continuato, finché qualcuno mi ha fatto notare una cosa ovvia: per quanto il mio blog non sia uno spazio espressamente for-profit, i suoi contenuti mi permettono di ottenere nuovi lavori. Utilizzando un’immagine generata con Midjourney con l’intento di fornire al post un artwork di qualità percepibile come professionale, finivo indirettamente per privare un vero artista di un potenziale compenso. Non solo: nel farlo, pagavo un abbonamento a Midjourney, che aveva generato quelle immagini attingendo a un dataset contenente immagini di artisti che avrebbero potuto fare quel lavoro al posto dell’algoritmo. Da allora, ho smesso.

Esistono quindi dei rischi pratici, legati all’utilizzo di un algoritmo anziché la commissione a un artista, per la creazione di un contenuto visivo che passi quantomeno per credibile. Esistono, poi, dei rischi più filosofici e legati al nostro modo di percepire la creatività: se questi algoritmi permettono la generazione automatica (e rapida) di opere visive a partire dai loro dataset, sul medio termine il rischio è di assistere a una saturazione di immagini che potrebbero essere percepite come creative, ma che altro non sono che la ricombinazione delle caratteristiche di altre immagini già esistenti. In questo senso, è davvero possibile definire un’intelligenza artificiale creativa?

Secondo Marcus du Sautoy, un matematico della Oxford University intervistato dal The Guardian, è importante distinguere i modelli di diffusione latente (come quelli di Stable Diffusion e DALL-E), da quelli a rete generativa avversaria (GAN). Nel primo caso, secondo Sautoy, le intelligenze artificiali stanno replicando una creatività di tipo “combinativo, perché gli algoritmi sono istruiti a creare nuove immagini nello stesso stile di altre milioni presenti nel dataset.” Nel caso delle GAN, invece, si può parlare di “creatività trasformativa” […] perché permettono “uno scambio tra due reti, una che crea nuove immagini, l’altra che decide quanto bene quell’immagine generata rispecchia determinate caratteristiche,” si legge nell’articolo del The Guardian. “Una GAN artistica potrebbe avere come obiettivo la creazione di un’immagine che sia quanto più possibile diversa da quelle presenti nel suo dataset, senza però allontanarsi dalla categoria di ciò che gli umani potrebbero interpretare come arte visiva.”

Cosa possono fare gli artisti?

Come spesso accade quando si parla dell’impatto delle tecnologie digitali sugli esseri umani, esiste un piano istituzionale e un piano più pratico. Dal punto di vista formale, nei prossimi anni tribunali e corti saranno impegnate sempre di più nella discussione di casi di questo tipo e dovranno maturare (sperabilmente) le competenze necessarie per definire dei confini tecnici alla definizione di creatività legata alle intelligenze artificiali generative. Nel frattempo, però, questi strumenti sono già alla portata del grande pubblico ed è fondamentale per gli artisti potersi tutelare.

Strumenti come Have I Been Trained? permettono a chiunque di effettuare una ricerca all’interno del database LAION-5B, quello usato da Midjourney e altri, per verificare la presenza delle proprie opere o meno. Ancora, script come NO AI permettono a chiunque di applicare alle proprie opere originali un watermark che impedisce ai bot utilizzati per fare raccolta (scraping) di immagini di acquisirle.

Resta, però, un punto importante da affrontare: molto probabilmente, le intelligenze artificiali generative sono arrivate per restare. Altrettanto probabilmente, i loro casi d’uso reali saranno estremamente specifici e lontani da un’applicazione concreta per il grande pubblico. Immaginare forme di collaborazione con questi nuovi strumenti non è soltanto una contingenza storica, ma in un certo senso il compito stesso dell’artista che si ritrova a interagire sempre con nuovi strumenti.

Ponendo in primo piano le implicazioni etiche ed economiche dell’utilizzo di questi algoritmi, è possibile immaginare di includere il loro potenziale apparentemente creativo nei processi artistici. In questo senso, è fondamentale interpretare queste tecnologie non come strumenti, ma come interlocutori in grado di interpretare un ruolo specifico (deciso dall’artista) e cogliere i risultati generati dall’algoritmo come spunti creativi. È possibile, per esempio, chiedere a ChatGPT di simulare un personaggio specifico (un pesce palla in grado di pensare) e sottoporgli una parte dell’opera (per esempio, un racconto ambientato nell’oceano) per vedere generare dei risultati non fattualmente creativi, ma ispirati da una messinscena assurda e testabile in tempo reale.

La generazione di opere creative attraverso l’utilizzo di intelligenze artificiali generative è una tecnica indubbiamente popolarissima, in questo momento, ma non è ancora chiaro quanto realmente incisivi saranno gli impatti di questi strumenti sulle economie dell’arte e della creatività. Nel quotidiano sforzo di sensibilizzazione necessario a ristrutturare i proclama tecno-ottimisti che spesso interpretano queste tecnologie come panacee in grado di sollevare gli umani da qualunque incarico produttivo (spesso ignorando le conseguenze sociali di un’evoluzione di questo tipo), possiamo cogliere la possibilità per analizzare il modo in cui queste innovazioni stanno interagendo con il nostro modo di percepire la creatività. E interrogarci, soprattutto, sul fatto che stiano ampliando o restringendo le nostre possibilità immaginative.