Open Data e flussi informativi, approcciare il Data Quality con l'open source

I flussi informativi sono spesso una delle fonti dati di maggiore importanza nei sistemi della PA. Quotidianamente gli enti interscambiano milioni di dati attraverso questi flussi per alimentare le varie banche dati e la maggior parte dei software utilizzati sono chiusi, proprietari e costosi. Per fortuna il concetto di Open Data (attravero canali come dati.gov.it), sempre più condiviso, rende di dominio pubblico un numero sempre maggiore di flussi informativi (contenenti dataset).
Ma come possiamo alimentare, con i dataset Open, la nostra banca dati garantendone la qualità? La problematica del Data Quality è tanto sentita quanto sottovalutata perchè i dati ridondanti, errati o incompleti, possono rendere inutilizzabile o inefficace la nostra banca dati.
Un Data Quality Firewall è come un filtro che in tempo reale fa acquisire solo i flussi informativi con le caratteristiche certificate e l'unica implementazione open source di questo essenziale strumento è jValidator.
E' stato spiegato come con jValidator sia possibile (senza particolari competenze tecniche) configurare un Open dataset e alimentare periodicamente e in modo automatico la propria banca dati con dati puntuali e validati, ma anche monitorare i flussi informativi ricevuti e ricevere eventuali segnalazioni di anomalie in tempo reale e anche via mobile.

Nessun voto

Anteprima

Nello stesso convegno Vai al programma Vai al programma del convegno