Sabato, 21 febbraio 2015
12.00 – 00.00 CET
Centro Nexa su Internet e Società (DAUIN), Politecnico di Torino
Via Boggio 65/a, Torino (primo piano)
In occasione della quinta edizione dell’International Open Data Day e del terzo International Open Data Day italiano, il Centro Nexa su Internet & Società del Politecnico di Torino, con il supporto di Regesta.exa e la collaborazione di Otto, Cosvifor e Innovazione e Sistemi per il Lavoro ed il Mercato, organizza un Linked Open Data Hackathon con l’obiettivo principale di rendere semantici i dati della pubblica amministrazione piemontese, a partire dai dataset pubblicati sul portale dati.piemonte.it.
L’hackathon si rivolge a sviluppatori, civic hackers, studenti e ricercatori che vogliono cimentarsi con lo sviluppo di codice open source e l’utilizzo di tecnologie standard del Semantic Web e dei Linked Data, che costituiscono oggi lo stato dell’arte della pubblicazione degli Open Data della pubblica amministrazione a livello internazionale.
Come si svolgerà la giornata
L’hackathon si svolgerà dalle ore 12.00 alle ore 00.00 CET di sabato 21 febbraio 2015. Nella fase iniziale ci sarà una discussione fra i partecipanti per definire i compiti di ciascuno per poter affrontare il challenge proposto (ciascun partecipante dovrà portare con sè il proprio portatile).
Dalle ore 15.30 alle ore 16.15 si svolgerà un intervento di Federico Morando, Director of Research and Policy & Research Fellow del Centro Nexa. Federico si confronterà con i partecipanti per individuare le modalità con cui il software sviluppato nell’hackathon potrà inscriversi nell’ambito del progetto del portale community.dati.piemonte.it, che nasce nell’ambito della collaborazione per la ricerca e lo studio di Internet e del suo impatto sulla società tra Regione Piemonte e il Centro Nexa. Il progetto intende essere un punto di pubblicazione unico di dati aperti a quattro o cinque stelle e sottoposto ad una governance informale (coordinata dal Centro Nexa su Internet & Società), esplicitamente collegato a dati.piemonte.it, ma anche chiaramente distinto dal portale ufficiale, in modo da permettere procedure più agili di sperimentazione.
Dalle ore 21 e fino alla fine dell’hackathon gli sforzi prodotti verranno concretizzati in un output che si tradurrà in codice open source pubblicato su GitHub, documentazione del processo e Open Data a disposizione della comunità.
Le sfide
- Scelta delle fonti di dati aperti: potranno essere utilizzati i dati pubblicati sul portale dati.piemonte.it, lavorando su dataset quali ad esempio “Musei Regione Piemonte” e Ricettività turistica – Anagrafica esercizi – 2013.
- Esposizione dei dati secondo lo standard RDF: in occasione dell’hackathon verrà messo a disposizione su GitHub, con il supporto di Regesta.exe, codice open source che utilizza le API di Jena per convertire dati in CSV in dati in RDF.
- Favorire l’interoperabilità semantica per il riutilizzo delle informazioni: estendendo il codice menzionato al punto precedente ed utilizzando ontologie standard del web semantico come ad esempio GoodRelations, l’RDF prodotto potrà essere collegato al web dei dati. Per le informazioni non strutturate, verranno messe a disposizione dei partecipanti le API di TellMeFirst, software open source per la classificazione semantica e l’arricchimento di documenti testuali basato su Wikipedia/DBpedia.
- Gestione dei dati RDF e pubblicazione: verrà messa a disposizione dei partecipanti in anteprima un’istanza di Bygle Open Source, interfaccia LDP dell’Enterprise Linked Data Platform Java2ee, sviluppata da Regesta.exe, capace di gestire completamente l’importazione e il processamento di dati RDF. Verrà inoltre messa a disposizione dei partecipanti un’istanza di LodView, basata su Spring e Jena in grado di offrire un supporto per la “dereferenziazione” degli URI e la pubblicazione di dati RDF secondo gli standard per i Linked Open Data definiti dal W3C.
Chi intendesse partecipare può scrivere direttamente a giuseppe.futia@polito.it entro giovedì 19 febbraio 2015.
La partecipazione alla sessione di discussione dalle ore 15.30 alle ore 16.15 non richiede iscrizione e sarà trasmessa in streaming.
Al termine della giornata, il progetto che più fra tutti avrà valorizzato l’utilizzo di open data vincerà questa sfida e il relativo premio.
Codice open source
Gestione degli orari di apertura e chiusura dei Musei piemontesi: http://nbviewer.ipython.org/gist/steko/0d87f5b9e32691de28be
OntoMapper – Mapping delle triple all’interno di un file RDF: https://github.com/thermz/OntoMapper