Articolo

Se dici Open Data dici Open Census

In un immaginario (abbastanza) collettivo, quando dici dati dici Istat e quando dici Istat dici Censimenti. “Il Censimento è una roba che se non ci fosse bisognerebbe inventarla”, diceva Andrea Nelson Mauro, data journalist e attivista dell’open data italiano, introducendo il Data Lab #Censimenti - Open Census, promosso da Istat lo scorso ottobre a Smart City Exhibition 2013. (Qui programma, atti e storify della tre giorni autunnale di laboratorio sui dati).
Alle soglie dell’Open Data Day 2014 che arriva, il prossimo 22 febbraio, a margine dell’ultima tornata censuaria (Popolazione, Agricoltura, Industria e servizi e Non Profit), ci "affacciamo" su questa relazione dalla natura fortemente complementare: community open data da un lato, Istituto nazionale di statistica dall’altro.

Da un lato la comunità open data  che, affamata di dati, guarda da sempre all’Istituto nazionale di statistica come al detentore di un vero e proprio tesoro pubblico; dall’altro l’Istat che, in quanto principale produttore di statistica ufficiale, ha come sua missione quella di servire la collettività attraverso la produzione e la comunicazione di informazioni statistiche, analisi e previsioni di elevata qualità, con l’obiettivo di sviluppare un'approfondita conoscenza della realtà ambientale, economica e sociale dell'Italia ai diversi livelli territoriali e favorire i processi decisionali di tutti i soggetti della società.

Per la comunità open data – composta da utilizzatori a livelli diversi e con diversi scopi (dai giornalisti ai policy maker ai ricercatori)  - i Censimenti Istat rappresentano un po’ "la mamma di tutti i dataset".  Come spiega Nelson Mauro, "la capacità delle rilevazioni censuarie di raccogliere dati a livello territoriale, in tutto il paese, diventa un elemento cruciale per ogni visualizzazione sui dati". Così "il Censimento diventa un po’ il grande dataset al quale necessariamente molte elaborazioni data driven devono fare riferimento.”

Il fatto che gli ultimi Censimenti (2010 - 2011) restituiscano tutti i dati in formato aperto rappresenta una inedita possibilità di adottare prospettive diverse di analisi, incrocio delle informazioni statistiche e dunque di lettura della nostra realtà. 

Stiamo lavorando per arrivare a 5 stelle

Andrea Mancini, allora Direttore del Dipartimento per i Censimenti e i Registri Amministrativi e Statistici dell'Istat aprendo il Data Lab a Smart City Exhibition 2013, era stato chiaro: “In tema di open data stiamo lavorando per arrivare a 5 stelle”.

 

 


Andrea Mancini – Open Census from Istituto nazionale di statistica

 

“L’Open Census - conferma ora Emanuele Baldacci, Direttore Dipartimento per l'integrazione, la qualità e lo sviluppo delle reti di produzione e di ricerca dell’Istat  -  rappresenta un grande avanzamento, coerente con la strategia dell’Istat orientata a fornire agli utilizzatori sempre più informazioni utili e possibilità di personalizzazione nell’uso dei dati”. Per la community di utilizzatori, questo si traduce innanzitutto nel “poter disporre dei dati censuari in formati direttamente riusabili sia da macchine sia da utenti, favorendo il collegamento con altri dati”. “La cosa più importante – ci spiega il direttore Baldacci -  è la connotazione semantica che accompagna il rilascio in formato aperto. Infatti, oltre al livello  - ormai classico e consolidato da parte Istat - di rilascio in formato testuale (ad esempio CSV), si punta a pubblicare i dati del Censimento come Linked Open Data (LOD)".  E last but not least "i dati vengono descritti da ontologie standard definite in ambito W3C ed è quindi possibile tracciare la provenienza (provenance) ufficiale del dato”.

LOD e SPARQL EndPoint, un cambio di passo

Dunque, "l’Istat rende disponibili già da tempo i dati in formati non proprietari e aperti ma - sottolinea Baldacci - abbiamo optato per l’adozione del paradigma dei Linked Open Data perché rappresenta un’opportunità importante per gli utilizzatori”.  E continua spiegando che “la pubblicazione in formato aperto e linkato delle classificazioni ufficiali dell’Istat (attività economiche, strutture territoriali, classificazione della spesa pubblica ecc.) favorisce l’interoperabilità dei dati tramite la condivisione di metadati comuni e permette la navigazione tra più dataset collegati tra di loro in modo esplicito. Ad esempio, nella pubblicazione prevista per i dati del Censimento della Popolazione del 2011 saranno resi disponibili non solo dati statistici relativi alle sezioni di Censimento, ma anche il loro collegamento con le basi territoriali, cioè la struttura informativa che ne permette il riferimento territoriale e la riaggregazione su livelli di territorio superiori”

“Il prossimo passo sarà quello di estendere gli ambiti statistici pubblicati in modalità LOD, con riferimento sia alle classificazioni ufficiali sia alle statistiche dei settori di produzione. L’obiettivo è creare dei punti di accesso unificati ai dati aperti, i cosiddetti SPARQL EndPoint, mettendo a disposizione una gamma di servizi di diffusione, costituita sia da interfacce grafiche di interrogazione user friendly per utenti finali sia da “facility” per l’accesso diretto ai dati tramite interrogazioni definite dall’utente”.

Verso l’open data engagement

Emanuele Baldacci conclude riaffermando che “il passaggio dalla produzione di dati alla produzione di informazioni utili per la conoscenza è il valore aggiunto dell’innovazione nel campo della produzione statistica ufficiale”.

In questo senso, proprio in questi giorni, Istat conferma un impegno importante.
Facendo seguito all'annuncio dato al Data Lab #Censimenti a Smart City Exhibtion 2013, ha lanciato lo scorso 17 febbraio,  #Censimenti Data Challenge: un contest sul riuso dei dati raccolti e diffusi dall’Istat con il  9° Censimento generale dell’Industria e dei Servizi e Censimento delle Istituzioni non profit .

La finalità è lo sviluppo di visualizzazioni, storytelling e/o applicazioni usando i dati del Censimento, che possono i essere liberamente elaborati e incrociati con ogni altro dataset rilasciato dall’Istituto o da altri soggetti pubblici e privati.

Per esplicito riconoscimento dell'Istituto il contest rappresenta un passo in avanti in tema di open data engagement, nella consapevolezza che i dati sono di tutti e che la costruzione di conoscenza e servizi utili può passare attraverso coinvolgimento e collaborazione tra le forze attive nella società.

Come spiegava Andrea Mancini a Smart City Exhibition, l'Open Census prevede un'azione di cura su tre livelli: la qualità del dato, l'aspetto tecnologico, la partecipazione. "C'è evidentemente una questione tecnologica che però va coniugata con l'esigenza di curare gli aspetti della domanda dei dati. Bisogna investire per incentivare questa domanda, cioè la capacita della società di usare i dati a fini di conoscenza e a fini decisionali e occorre fare iniziative nuove. Non basta fare il datawarehouse, per intenderci. Bisogna partecipare per avere maggiore partecipazione e far crescere la cultura del dato statistico che sicuramente in Italia puo ancora svilupparsi molto".

 

 

 #Censimenti Data Challenge 

Regolamento

    Form di registrazione

 

 

 

 

 

Your rating: Nessuno Average: 3.5 (4 votes)

Contenuti del Dossier