Skip to content Skip to footer

I social stanno rendendo più difficili le indagini su crimini e disinformazione

Bellingcat: Truth in a Post Truth World

Immagine in evidenza dal film: “Bellingcat: Truth in a Post Truth World”

L’onda di cambiamenti che ha travolto Twitter nei mesi successivi all’acquisizione di Elon Musk lo scorso ottobre ha prodotto un gran trambusto, prima di lasciare spazio a ChatGPT e ai relativi dibattiti legati all’intelligenza artificiale. Nel marasma generale, un episodio di questa travagliata vicenda è passato però in sordina: dopo l’annuncio iniziale di febbraio, lo scorso marzo Twitter ha ufficializzato che l’accesso alle sue API (Application Programming Interface) non sarebbe più stato gratuito. Al contempo, le versioni premium di questo servizio avrebbero subito un aumento considerevole dei prezzi.

Le API sono interfacce che permettono alle applicazioni di interagire con altre, svolgendo il ruolo di canali di comunicazione tra siti web, applicativi, software o dispositivi diversi. Quelle di Twitter rappresentano fin dal 2006 uno strumento fondamentale per ricercatori e organizzazioni internazionali impegnate in attività di data analysis: permettono infatti di estrapolare e analizzare informazioni dal social network per approfondire temi critici (come il ruolo di troll e account falsi in occasione delle elezioni o quello svolto da campagne di molestie e attacchi coordinati contro esponenti della società civile critici di alcuni Governi), oltre che raccogliere e classificare foto e video, che possono essere utilizzati come prove di accusa nei confronti di criminali di guerra nei tribunali internazionali.

Un problema per la ricerca indipendente e l’analisi dei dati 

“La limitazione delle API di Twitter avrà un grosso impatto sui medio-piccoli ricercatori”, spiega a Guerre di Rete Alessandro Accorsi, senior analyst dell’International Crisis Group, organizzazione no profit transnazionale che dal 1995 svolge attività di ricerca per la prevenzione e la risoluzione di conflitti. “Questo strumento è utilizzato in primo luogo da accademici che hanno bisogno di pubblicare il database utilizzato come campione per le loro ricerche. In secondo luogo, da tutti coloro i quali fanno ricerca individuale. Diventerà, insomma, uno strumento più elitista”.

Come scritto in un dettagliato report dell’International Crisis Groups, limitare l’accesso alle API ai più abbienti ridurrà le analisi e “rafforzerà i pregiudizi occidentali legati alla ricerca sulla disinformazione (ovvero l’interesse esclusivo verso Usa ed Europa). A subire il colpo più duro saranno dunque le realtà che operano nei Paesi del cosiddetto Sud Globale, dove le indagini tramite social e le campagne di fact-checking rappresentano ancora uno strumento poco diffuso ma di fondamentale importanza: i piccoli osservatori di Internet, come AfricaCheck e DoubleThink Lab (che svolgono un ruolo centrale per la diffusione di informazioni accurate in Africa e Asia), pagheranno carissimo il cambio di politiche attuato da Twitter.

Del resto, questo stravolgimento di policy è perfettamente in linea con i cambiamenti aziendali voluti dalla nuova direzione di Elon Musk, a seguito dell’acquisizione della piattaforma da parte del patron di Tesla lo scorso ottobre (dopo mesi di schermaglie legali). Musk ha spiegato che la politica delle API “è stata abusata pesantemente dai bot scammers e dai manipolatori di opinioni”. Mettendo un prezzo al biglietto d’ingresso, l’imprenditore di origini sudafricane punta a ridurre il numero di account automatizzati e monetizzare il più possibile. 

Le nuove tariffe per l’utilizzo delle API di Twitter

In un thread di fine marzo, l’account ufficiale degli sviluppatori di Twitter ha comunicato i nuovi piani previsti per avere accesso alle sue API (gratuito, base ed enterprise), fornendo al tempo stesso dettagli su prezzi e limiti di lettura e scrittura.
Le tariffe imposte precludono l’accesso alla maggior parte degli utenti. Nella sezione Enterprise, il piano Small Package costa attualmente 42mila dollari al mese e permette l’accesso a 50 milioni di tweet (circa lo 0,3% dei 375 milioni di tweet che in media vengono pubblicati sul social ogni giorno), mentre la vecchia API gratuita forniva da sola l’accesso all’1% del totale dei cinguettii giornalieri. Il pacchetto di abbonamento più avanzato tocca quota 210mila dollari al mese e offre l’accesso a 200 milioni di tweet. Si tratta di costi assolutamente insostenibili per gran parte delle Ong, degli studenti e dei ricercatori privati che per anni hanno avuto accesso a milioni di dati ogni mese in maniera gratuita (o comunque a prezzi più contenuti). 

L’unica eccezione è rappresentata dalle PA e da alcuni servizi di pubblica utilità che si occupano di avvisi meteo, aggiornamenti sui trasporti e notifiche di emergenza, i quali continueranno a utilizzare tali strumenti gratuitamente. Anche in questo caso però, le ragioni sono prettamente economiche: “Se la Metropolitan Transportation Authority di New York – prosegue Accorsi – avesse smesso di utilizzare Twitter per dare gli aggiornamenti sul traffico e sui servizi dei treni, la piattaforma avrebbe perso centinaia di migliaia di utenti che la usano fondamentalmente solo per quello. Del resto, l’Europa non rappresenta per Twitter un mercato prioritario”, e anche per questo il social si è ritirato dal codice di condotta volontario contro le fake news (ma combattere la disinformazione diverrà un obbligo con l’entrata in vigore del Digital Service Act il 25 agosto). “Piuttosto che pagare le penalità che l’Ue gli potrebbe infliggere, Musk è tranquillamente disposto a perdere l’intero mercato per concentrarsi esclusivamente sugli Stati Uniti e sul resto del mondo. È la sua logica economica”, continua Accorsi.

L’importanza delle API nelle democrazie e nei conflitti

Nel corso degli ultimi diciassette anni, la politica “free API” di Twitter ha contribuito a smascherare operazioni di influenza e ingerenza a livello internazionale. Ne è un fulgido esempio il caso legato alla Internet Research Agency (IRA) russa, la cosiddetta fabbrica di troll gestita da Yevgeny Prigozhin, l’oligarca e capo del gruppo Wagner, la compagnia militare privata di cui si è molto parlato negli ultimi giorni dopo l’abortita marcia su Mosca. L’IRA è stata spesso accusata di aver cercato di interferire attraverso campagne sui social e profili finti nella politica degli Usa e di altri Paesi, incluse le elezioni statunitensi del 2020 e la guerra in Siria. Caso eclatante fu l’attacco al villaggio di Khan Shaykhun, che causò la morte di circa cento persone: l’agenzia vicina a Putin (sostenitore del regime di Bashar al-Assad) promosse falsità e tentò di delegittimare i caschi bianchi siriani e le altre organizzazioni umanitarie presenti nel Paese, denuncia un report dell’organizzazione per i diritti umani The Syria Campaign, stimando che tra il 2016 e il 2017 queste iniziative di disinformazione siano state visualizzate 56 milioni di volte su Twitter.

Le API di Twitter hanno contribuito a scoprire attività di disinformazione coordinate legate all’IRA e finalizzate a sostenere determinati candidati o a seminare sfiducia nei processi elettorali di diversi Paesi africani.
Lo Stanford Internet Observatory aveva identificato una serie di campagne Facebook condotte proprio dal gruppo Wagner di Prigozhin in Congo, Repubblica Centrafricana, Madagascar, Mozambico e Sudan.
Allo stesso modo, le API hanno fatto emergere l’attività mediatica social che in Colombia ha minato la legittimità dei colloqui di pace tra il Governo e le Forze Armate rivoluzionarie (FARC).

Non finisce qui. In base a quanto emerso dalle rivelazioni di Frances Haugen, la whistleblower che nel 2021 diffuse il contenuto di migliaia di documenti interni a Facebook, e da successivi report di Ong, gli algoritmi del social network di Mark Zuckerberg sono stati accusati di dare particolare visibilità a post di odio contro i Rohingya, vittime di un genocidio in Myanmar nel 2017. Come testimoniato dal rapporto del Consiglio per i diritti umani delle Nazioni Unite sul Myanmar, per indagare sull’uccisione delle oltre 24mila vittime sarebbe stato utile possedere “dati specifici sulla diffusione dell’incitamento all’odio”. Tuttavia, a differenza di quanto fece Twitter, all’epoca Facebook non rese disponibili API ad accesso libero utili a tale scopo.

Infine, non va dimenticato che analisti e ricercatori sono stati in grado di prevedere la data di inizio della guerra in Ucraina, monitorando i movimenti delle truppe russe attraverso una combinazione di informazioni pescate dai social media e dati di tipo open source. Senza tralasciare l’incredibile lavoro di testate giornalistiche come Bellingcat, che fin dai primi giorni del conflitto hanno sfruttato strumenti digitali di vario genere per accertare la veridicità di fatti che, spesso, provenivano da account di civili ucraini. 

Tutti questi esempi convergono nella medesima conclusione: l’ampia disponibilità degli strumenti API delle piattaforme social permette di formulare analisi approfondite di campagne d’odio e di influenza, e talvolta anche di crimini perpetrati nei contesti bellici di tutto il mondo. Sfortunatamente, negli ultimi tempi queste possibilità si stanno riducendo.

Una tendenza comune tra i social media

I recenti cambiamenti di policy da parte di diverse piattaforme hanno messo in crisi chi utilizza i social network per attività di ricerca. Il fenomeno non riguarda solo Twitter: le voci relative a un’imminente chiusura di CrowdTangle, lo strumento di ricerca di Meta per l’acquisizione di dati da Facebook e Instagram (una sorta di API “semplificata” e facilmente accessibile), sono state riportate da diverse testate. 

“C’è una tendenza generale a limitare l’accesso pubblico ai dati e a fare transparency washing”, conclude Accorsi. L’obiettivo è trasmettere un’immagine di trasparenza e disponibilità; nei fatti, però, l’accessibilità è fortemente contenuta. “Dopo lo scandalo di Cambridge Analytica, Meta ha limitato l’accesso ai propri dati per evitare nuovi episodi del genere. Attualmente la ricerca complessa viene fatta da pochissime istituzioni che hanno accordi con Facebook e che possono permettersi di farlo”.
In questo scenario, la scomparsa di CrowdTangle porterebbe la compagnia di Zuckerberg a chiudersi ulteriormente in un guscio impenetrabile.

TikTok merita un capitolo a parte. All’inizio di quest’anno il social cinese ha reso disponibile un’API rivolta agli utenti, in uno slancio comunicativo volto alla trasparenza dopo le continue polemiche e le pressioni bipartisan da parte della politica statunitense. Tuttavia, lo strumento presenta delle condizioni di utilizzo particolarmente restrittive: i fruitori devono aggiornare regolarmente i dati dell’API di ricerca almeno ogni quindici giorni e devono eliminare quelli che non sono più disponibili al momento di ogni aggiornamento.

Inoltre, dopo l’audizione del Ceo dell’azienda Shou Zi Chew davanti al Congresso americano lo scorso marzo, la compagnia ha aperto un vero e proprio “Transparency and Accountability Center” a Los Angeles. In un articolo di The Verge, il giornalista americano Alex Heath racconta la sua visita in occasione di un tour organizzato da TikTok e rivolto alla stampa. Nell’hub c’è di tutto, compresa una sorta di stanza dei segreti: come riportato dal giornalista, “dietro una parete con un’illuminazione simile a quella della Morte Nera, i funzionari hanno dichiarato l’esistenza di una sala server che ospita il codice sorgente dell’app, esaminabile da revisori esterni”. Chi entra deve firmare un accordo di non divulgazione, passare attraverso i metal detector e chiudere il proprio telefono in un armadietto. Il centro sembra più un’operazione d’immagine (“virtue signalling”), commenta Heath.

Infine, c’è Reddit. Da un paio di settimane il network nato nel 2005 (e undicesimo sito web più visitato al mondo) sta assistendo a una gigantesca protesta intestina che coinvolge oltre 3mila delle sue community. La rivolta è iniziata dopo l’annuncio da parte della piattaforma di voler far pagare agli utenti le proprie API e sta minacciando seriamente l’esistenza dell’intera infrastruttura. In questo caso, la scelta è legata al fenomeno dello scraping che riguarda le intelligenze artificiali: ChatGPT ha fatto razzia dei dati di Reddit per allenare la propria IA, per questo ora la proprietà della piattaforma sta cercando di salvaguardare il proprio “patrimonio” e soprattutto di monetizzare da tale pratica.

La conferenza su un mondo post-API

Di fronte a questo scenario i ricercatori stanno suonando un allarme. “Se utilizzate i dati dei social media per le vostre ricerche, vi conviene ascoltare, perché abbiamo raggiunto un punto di crisi. L’accesso ai dati digitali è sopravvissuto per anni in un flusso scomodo e imprevedibile, ma la più recente ondata di cambiamenti politici potrebbe essere esistenziale”. Così scrivono gli organizzatori di una conferenza prevista ad ottobre negli Usa il cui fulcro sarà proprio “The Post-API Conference: Social media data acquisition after Twitter” (La conferenza post-API: l’acquisizione di dati dai social media dopo Twitter).

Al netto delle scelte aziendali di realtà molto diverse tra loro (in termini di etica, policy e fatturato), la tendenza sembra universale. Che ne sarà di un mondo in cui i social network diventeranno sempre più restii a condividere i propri dati? Analisti, ricercatori autodidatti e giornalisti senza grandi finanziatori alle spalle saranno sempre più estromessi dalla ricerca della verità.