Federico Cairo
(research fellow Centro Nexa)
Mercoledì 23 gennaio 2013, ore 13.00 – 14.00
Centro Nexa su Internet & Società
Politecnico di Torino, via Boggio 65/a, Torino (1° piano)
Ingresso libero
Prenota qui
L’organizzazione della conoscenza presente sul Web è uno degli strumenti principali per ridurre l’information overload sperimentato quotidianamente dagli utenti di Internet. In occasione del 7° Nexa Lunch Seminar Federico Cairo, research fellow del Centro Nexa su Internet & Società, illustrerà il suo lavoro di ricerca, riguardante la classificazione automatizzata dei documenti in Rete per mezzo dei concetti presenti su DBpedia. Nato nel 2007 dalla collaborazione di Università Libera di Berlino, Università di Lipsia e OpenLink Software, DBpedia è un progetto per l’estrazione di dati strutturati dal “corpus” di Wikipedia e alla pubblicazione dei dati stessi sul Web in formato Linked Data.
L’opportunità dell’utilizzo di DBpedia per la classificazione della conoscenza sul Web è sostenuta sia da aspetti puramente tecnici sia da valutazioni più teoriche. Essendo DBpedia collegata a un vasto “corpus” multilingue preannotato di carattere enciclopedico (Wikipedia), essa risulta tecnicamente molto adatta ad essere utilizzata per procedimenti automatici di natural language processing e di text mining. Ma la cosa più interessante è che i concetti presenti in DBpedia sono il risultato di un consenso semantico raggiunto in maniera collaborativa dalla comunità degli internauti. Un criterio efficace di classificazione sul Web, infatti, non può essere imposto dall’alto, ma deve seguire gli stessi principi di libertà e trasparenza che hanno da sempre costituito l’essenza di Internet.
La conoscenza contenuta in Wikipedia, e di conseguenza in DBpedia, è frutto di quell’intelligenza collettiva e di quella cultura collaborativa che sembrano emergere come i tratti costitutivi delle comunità in Rete. I software che utilizzano Wikipedia e DBpedia per l’estrazione e l’arricchimento dei contenuti sul Web, come per esempio TellMeFirst, progetto vincitore di un grant Working Capital Telecom 2011 e ulteriormente sviluppato all’interno del Centro Nexa da Federico Cairo e Giuseppe Futia, fanno appunto leva su questa “saggezza della folla”, mostrandone le potenzialità e i benefici per gli utenti di Internet.
Biografia
Federico Cairo, research fellow presso il Centro Nexa su Internet & Società e dottorando di ricerca al Dipartimento Interuniversitario di Studi regionali (DIST) del Politecnico di Torino, si è laureato in Filosofia presso il Collegio Superiore dell’Università di Bologna (2005) e in Ingegneria dell’Informazione presso il Politecnico di Torino (2008). La sua attività di ricerca si concentra principalmente sulle tecnologie del Semantic Web per gli archivi digitali e su motori di ricerca basati su ontologie. Dopo aver collaborato come ontology engineer con CSI-Piemonte e CELI sui progetti CoOPERARE (2010), dati.piemonte.it (2010), OPSA (2011), è stato uno dei vincitori dell’edizione 2011 di “Working Capital – Premio Nazionale Innovazione” di Telecom Italia con il progetto TellMeFirst, un’applicazione di arricchimento dei testi via Linked Open Data.
Letture consigliate e link utili
- Exner, P., Nugues, P. (2012) Entity extraction: From unstructured text to DBpedia RDF triples. The Web of Linked Entities Workshop (WoLE 2012)
- Mendes, P. N., Jakob, M., García-Silva, A., & Bizer, C. (2011). DBpedia Spotlight: Shedding Light on the Web of Documents. Text (pp. 1-8). Facultad de Informática (UPM)
- Muñoz-García, O., García-Silva, A., Corcho, Ó., De La Higuera Hernández, M., & Navarro, C. (2011). Identifying Topics in Social Media Posts using DBpedia. (J.-D. Meunier, H. Hrasnica, & F. Genoux, Eds.)Media, 28020, 81-86. Facultad de Informática (UPM)
- Bizer, C., Lehmann, J., Kobilarov, G., Auer, S., Becker, C., Cyganiak, R., & Hellmann, S. (2009). DBpedia – A crystallization point for the Web of Data. Web Semantics Science Services and Agents on the World Wide Web, 7(3), 154-165. Elsevier.