100° Nexa Lunch Seminar - Produzione etica dei dataset per l’intelligenza artificiale: il ruolo della documentazione

Per il ciclo di incontri “i Nexa Lunch Seminar” (ogni 4° mercoledì del mese)
100° Nexa Lunch Seminar*

Produzione etica dei dataset

per l’intelligenza artificiale:

il ruolo della documentazione


Marco Rondina (Politecnico di Torino)


Mercoledì 28 settembre 2022 ore 13 in punto
(termine: ore 14)

L'INCONTRO SI TERRÀ IN PRESENZA E ONLINE
SEDE FISICA:
Centro Nexa su Internet e Società, Politecnico di Torino, Via Boggio 65/a, Torino (1° piano)
(Per maggiori informazioni su come raggiungerci clicca QUI)
STANZA VIRTUALE:
https://didattica.polito.it/VClass/NexaEvent


Lunch100

La ricerca e lo sviluppo industriale dell’intelligenza artificiale hanno fatto passi da gigante negli ultimi anni, rendendo le tecnologie basate su di essa sempre più pervasive all’interno della società (anche in settori molto delicati come welfare, giustizia, credito, etc) e contribuendo ad automatizzare processi e decisioni. Uno degli elementi chiave alla base dell’IA sono i dati, i quali spesso determinano la qualità dei risultati ottenuti.

Per questo è sempre più importante far sì che i professionisti dell’IA siano pienamente consapevoli delle caratteristiche dei dati e dei processi che li hanno generati, comprese le scelte progettuali più o meno implicite e basate su presupposti tutt’altro che neutri. La documentazione dei dataset può rappresentare uno strumento molto utile in questa prospettiva. Essa rappresenta la principale forma di comunicazione tra produttori e utilizzatori dei dataset, in grado di rendere trasparente il contesto attorno il quale i dati sono stati raccolti, annotati e trasformati.

In questa ricerca è stato individuato un insieme di informazioni rilevanti che dovrebbero sempre essere allegate ad un dataset per garantirne un utilizzo consapevole. In secondo luogo, sono state analizzate le documentazioni dei 100 dataset più popolari tra alcune delle principali piattaforme del settore al fine di valutarne la completezza. Quello che emerge è la necessità di una maggiore attenzione al processo di documentazione, anche per garantire risultati più equi.


Biografia:

Marco RONDINA ha studiato Ingegneria Informatica al Politecnico di Torino, con specializzazione Data Analytics. Durante il suo percorso di studi, concluso nel luglio 2022, ha approfondito gli aspetti etici legati ai dati e, più in generale, agli strumenti digitali. Nella tesi di laurea dal titolo “Ethical Manufacturing of Datasets for Artificial Intelligence: an Empirical Investigation into the State of Documentation Practice” ha analizzato lo stato dell’arte della documentazione dei dataset usati nel settore dell’intelligenza artificiale.


Letture consigliate e link utili:

  • K. Crawford, The Atlas of AI, Yale University Press.
  • S. Barocas, M. Hardt, and A. Narayanan, Fairness and Machine Learning: Limitations and Opportunities, LINK
  • T. Gebru et al., Datasheets for Datasets, arXiv, LINK
  • A. Fabris, S. Messina, G. Silvello, and G. A. Susto, Algorithmic Fairness Datasets: the Story so Far, arXiv, LINK
  • M. K. Scheuerman, E. Denton, and A. Hanna, Do Datasets Have Politics? Disciplinary Values in Computer Vision Dataset Development, Proc. ACM Hum.-Comput. Interact., vol. 5, no. CSCW2, pp. 1–37, Oct. 2021, LINK


Scarica la versione PDF della presentazione di Marco Rondina.


Video dell'incontro:




Che cosa sono il Centro Nexa e i cicli di incontri “Mercoledì di Nexa” e “Nexa Lunch Seminar”:

Il Centro Nexa su Internet & Società del Politecnico di Torino (Dipartimento di Automatica e Informatica) dal 2006 è un centro di ricerca indipendente e interdisciplinare che, in collaborazione con l'Università di Torino, studia Internet (e più in generale le Tecnologie digitali) e i suoi rapporti con la società. Maggiori informazioni all'indirizzo: http://nexa.polito.it/about.

Durante i “Mercoledì di Nexa”, che si tengono ogni 2° mercoledì del mese alle ore 17 in punto, il Centro Nexa su Internet e Società apre le sue porte non solo agli esperti e a tutti coloro i quali lavorano con Internet, ma anche a semplici appassionati e cittadini. Il ciclo di incontri intende approfondire, con un linguaggio preciso ma accessibile, i temi legati alla Rete: motori di ricerca, Creative Commons, social networks, open source/software libero, neutralità della rete, libertà di espressione, privacy, file sharing, big e open data, smart cities e molto altro.

Al centro di quasi tutti gli incontri un ospite pronto a dialogare con i direttori del Centro Nexa, il Prof. Juan Carlos De Martin del Politecnico di Torino e il Prof. Marco Ricolfi dell'Università di Torino, nonché lo staff e i Fellows del Centro Nexa.

Maggiori informazioni sui Mercoledì di Nexa, incluso un elenco di tutti i “Mercoledì” passati, sono disponibili all'indirizzo: http://nexa.polito.it/mercoledi.

Si segnala inoltre che dal maggio 2012 ogni 4° mercoledì del mese dalle ore 13 alle ore 14 il Centro Nexa organizza anche i "Nexa Lunch Seminar". Una lista di tutti i “Lunch Seminar” passati è disponibile all'indirizzo: http://nexa.polito.it/lunch-seminars.

Per restare aggiornati sulle attività del Centro Nexa su Internet & Società, seguiteci su:

- Twitter: @nexacenter
- Facebook: @nexa.center
- Linkedin: Nexa Center for Internet & Society
- Instagram: nexa_center
- Mailing list degli annunci Nexa: nexa-announce@server-nexa.polito.it


*Non è previsto il servizio di catering