Se hai un account Flickr, o lo hai avuto in passato, e hai pubblicato almeno una foto di tuo figlio, tuo nipote o di un altro bambino è assai probabile che quella foto sia stata usata da decine tra aziende private ed enti di ricerca pubblici per allenare gli algoritmi di intelligenza artificiale per il riconoscimento facciale. Tutto questo è successo a tua insaputa, è uno scandalo ed ha un nome: MegaFace.
Tutto inizia nel 2014, quando ancora si parlava poco di AI, e le foto che sono state utilizzate in questo gigantesco progetto sono state pubblicate dagli utenti di Flickr a partire dal 2004, quando ancora nessuno parlava neanche di privacy online. Nel 2014 Flickr, che oggi è di proprietà di SmugMug ed è un servizio anche a pagamento, era ancora totalmente gratis e di proprietà di Yahoo.
Cos'è MegaFace e come è nato.
Le prime tecnologie di riconoscimento facciale risalgono ai primi anni '90. All'epoca i pochi centri di ricerca che lavoravano su questi algoritmi usavano le foto di volontari (spesso i loro stessi studenti), che si recavano volontariamente in uno studio fotografico e venivano immortalati da numerose angolature.
Il primo "training" degli algoritmi di riconoscimento facciale, quindi, è stato fatto con foto di persone adulte, tutte più o meno in età universitaria. Per questo ben presto i ricercatori, soprattutto quelli privati, sono passati a rastrellare le immagini delle telecamere di sorveglianza dei luoghi pubblici. Ma queste immagini erano spesso in bianco e nero e di scarsa qualità e bassa risoluzione.
Poi, per la gioia di chi lavora agli algoritmi di intelligenza artificiale, il mondo è diventato social e centinaia di milioni di persone hanno iniziato a pubblicare spontaneamente le loro foto, accettando le vaghe rassicurazioni contenute nelle privacy policy. E a questo punto nasce il progetto MegaFace: nel giugno 2014 Yahoo, che aveva acquistato Flickr dieci anni prima, annuncia di essere in possesso della più grande raccolta di file multimediali del mondo, con oltre 100 milioni di documenti tra foto e video.
È il cosiddetto "Yahoo Flickr Creative Commons 100 Million Dataset" (YFCC100M), è ancora online e contiene foto di luoghi, oggetti, alberi, piante, animali e persone messe gratuitamente a disposizione dei ricercatori proprio per allenare gli algoritmi. Per aggirare i problemi di privacy fu ideato uno stratagemma: non si può avere accesso alla foto originale, nonostante siano tutte foto in licenza Creative Commons, ma c'è un link diretto ad ogni foto pubblicata su Flickr. Chi non vuole che la propria foto sia usata, quindi, può cambiarne la licenza o rimuoverla direttamente dal proprio account Flickr.
Appena un anno dopo la pubblicazione del YFCC100M, nel 2015, due professori della University of Washington, Ira Kemelmacher-Shlizerman e Steve Seitz, usano le foto del dataset di Flickr per creare MegaFace. Si tratta di un "sotto-dataset" contenente solo le immagini di volti di persone: in totale 4 milioni di foto, di circa 672 mila persone. Bambini inclusi.
La MegaFace Challenge
Nel 2015 e nel 2016 l'università di Washington ha organizzato due "MegaFace Challenge": altri enti di ricerca e aziende private vengono invitate a usare il database di MegaFace per scopi "non commerciali, di ricerca ed educativi". Partecipano oltre 300 gruppi di lavoro e oltre 100 organizzazioni, tra le quali nomi famosi: Google, Tencent, SenseTime, NtechLab.
Nel frattempo, è uscito fuori che il progetto MegaFace ha ricevuto contributi, tra gli altri, anche da parte di Samsung, Google e Intel. Negli ultimi anni uno dei due creatori di MegaFace, la professoressa Ira Kemelmacher-Shlizerman, ha creato e venduto a Facebook una società che ha sviluppato una tecnologia per scambiare i volti nelle foto ed ha guidato il progetto della sua università sui deep fake, mostrando al mondo un finto video di Barack Obama che offende Donald Trump.
MegaFace sotto accusa
Negli ultimi tre anni il database di MegaFace è stato utilizzato per allenare gli algoritmi di società ed enti di ogni tipo e con gli scopi più vari, alcuni nobili e altri no: riconoscere e seguire i terroristi, pedinare gli oppositori politici, spiare la folla su larga scala e persino individuare i giocatori patologici. Adesso, però, c'è qualcuno che ha fatto causa a MegaFace e chiede un risarcimento: sono alcuni cittadini dell'Illinois, le cui foto pubblicate su Flickr quasi 15 anni fa sono state trovate su MegaFace.
Negli Stati Uniti la privacy è regolata in modo diverso da Stato a Stato. Nella maggior parte degli Stati americani non c'è alcun bisogno di chiedere il permesso per inserire una foto pubblicata online in un database, ma l'Illinois ha una delle leggi più restrittive al mondo in fatto di privacy. Il Biometric Information Privacy Act del 2008, infatti, prevede pene economiche per chi raccoglie senza autorizzazione l'impronta digitale o l'immagine del volto di un cittadino dell'Illinois.
Coloro che hanno utilizzato il database, incluse aziende come Google, Amazon, Mitsubishi Electric, Tencent e SenseTime, non si sono posti minimamente il problema della residenza dei legittimi titolari dei volti che hanno dato in pasto agli algoritmi e di conseguenza, potrebbero adesso dover pagare diversi milioni di dollari di risarcimento.
18 ottobre 2019