Raccoglie e fornisce informazioni di contesto sui dati presenti nei diversi sistemi aziendali, rendendole disponibili con una semplice ricerca: il Data Catalog è un “motore di ricerca” dei dati aziendali e può rivelarsi la carta vincente per le analisi delle aree strategiche di Business e un alleato per l’IT nelle sfide di data management.
Partiamo da un’esigenza di business decisamente attuale, soprattutto per le aziende B2C: conoscere in modo continuativo e allargato il cliente e come si interfaccia con l’azienda. Avere una visione ampia del cliente, la cosiddetta Customer 360, richiede la partecipazione attiva di molte funzioni fra le quali Marketing, Vendite, Servizio cliente e Finance.
Il Marketing, ad esempio, necessita di dati relativi ai percorsi di interazione cliente-azienda, considerando tutti i canali, la storia degli acquisti dei clienti, le promozioni proposte in passato, i servizi di cui hanno usufruito, le informazioni sulle loro abitudini e preferenze. Solo con una visione di questo tipo è possibile proporre campagne personalizzate, non commettere errori di comunicazione e fornire il supporto necessario al fine di costruire relazioni più durature.
Spesso accade che tutti questi dati siano prodotti ed elaborati da diverse persone e funzioni, e nessuno abbia una visione completa dei percorsi end-to-end del cliente e dei relativi dati. Quando questi dati non vengono integrati nei data lake o nei data warehouse aziendali, perché non ritenuti utili per le finalità analitiche e per i report utilizzati dal management, si generano i cosiddetti data silos: team operativi si creano e mantengono propri database e report utili per le loro attività quotidiane, senza che l’IT ne sia a conoscenza.

Un “motore di ricerca” dei dati aziendali? Esiste, e mette d’accordo strategie di business e IT.
Come conoscere e accedere facilmente a tutti i dati aziendali?
Quando i dati sono distribuiti in sistemi diversi e disponibili solo parzialmente ad alcune aree aziendali, una soluzione da valutare è l’adozione di un Data Catalog, a supporto sia delle attività di Data Management che degli utenti di Business.
Si tratta infatti di uno strumento che raccoglie e fornisce informazioni relative ai dati presenti nei diversi sistemi aziendali, rendendole disponibili con una semplice ricerca, come fosse un “Google” dei dati aziendali. Potremmo immaginarlo come l’inventario dei dati di cui l’organizzazione dispone, che contiene informazioni utili a fornire contesto ai dati e permette a IT, data scientist e analisti di business di trovare e comprendere meglio i dati.
In sostanza, il Data Catalog aiuta a raccogliere, gestire, mettere a disposizione i “dati relativi ai dati”, quelle informazioni tecnicamente chiamate “metadati“.
Metadati: l’importanza dei “dati che parlano dei dati”
I moderni Data Catalog sono strumenti di metadata management “attivi”: utilizzano algoritmi di Machine Learning per scoprire e raccogliere i metadati in maniera automatizzata, permettendo di superare le criticità legate alla non completa conoscenza di tutti i dati e i sistemi informativi di cui l’organizzazione dispone.
I metadati raccolti nel catalog possono essere di varia natura: tecnici, operativi, di business:
- Technical metadata: catalogano e descrivono i sistemi informativi, gli schemi, i tipi dato, alcune configurazioni tecniche dei sistemi, i data model fisici, i sistemi utilizzati per fini analitici, le applicazioni e gli strumenti con cui i dati vengono condivisi e/o analizzati;
- Operational metadata: descrivono il cosiddetto data lineage, cioè il percorso che i dati compiono tra i vari sistemi. Comprendono anche informazioni sulle performance di connessione ai sistemi e sulle trasformazioni che i dati subiscono quando vengono spostati o copiati da un sistema ad un altro.;
- Business metadata: si fa riferimento soprattutto al Glossary, alle ontologie, al significato semantico dei dati. Inoltre, rientra in questa categoria di metadati anche l’assegnazione delle ownership e stewardship di business, cioè delle persone che hanno responsabilità sulla affidabilità del dato, che ne certificano la qualità e si occupano di garantire la disponibilità nei tempi utili al business.
Agli utenti dell’IT e del business identificati come owner e steward rimane il compito fondamentale di arricchire e validare i metadati, così che il catalog diventi un vero e proprio strumento a disposizione di tutti i data consumer. L’arricchimento dei metadati può essere fatto descrivendo e fornendo esempi sui casi d’uso, definendo livelli di servizio, criteri e metriche per tenere monitorata la qualità dei dati.
Grazie al Data Catalog, tutti i data consumer possono effettuare ricerche in maniera semplice, scoprire rapidamente quali dati hanno a disposizione, capire come si presentano e che formato hanno, qual è il loro significato per l’azienda, dove risiedono, se e come possono accederci, se sono adatti per fare analisi affidabili (ad esempio perché sono stati certificati), e molto ancora.
Perché oggi è così importante avere a disposizione un Data Catalog?
Fino a qualche anno fa era più facile conoscere e raccogliere tutti questi metadati: c’erano meno sistemi informativi e tutti erano implementati in data center on-premise e non in Cloud, i dati subivano poche trasformazioni e venivano integrati in un unico Data Warehouse, ed erano utilizzati per analisi di Business Intelligence predefinite e per la reportistica direzionale per il top management.
Nel corso del tempo l’ecosistema dei dati è divenuto sempre più frastagliato e le attività di data management sempre più complesse. Per questo, gestire questa situazione è fondamentale: i dati sono troppo importanti e “delicati”, anche per questioni legate alla privacy e alla protezione di dati sensibili da minacce esterne.
Come scegliere il Data Catalog che risponde alle tue esigenze?
Non è semplice per una organizzazione scegliere il Data Catalog più adatto, ci sono tantissime soluzioni sul mercato, tecnologie più o meno ricche di funzionalità e che sposano approcci differenti: alcune sono più generaliste, altre sono forti su alcuni aspetti e ne trascurano altri. Inoltre, l’implementazione di un Data Catalog non è una questione solo tecnologica: si tratta di ridefinire processi, coinvolgere e responsabilizzare le persone, in alcuni casi favorire veri e propri cambiamenti organizzativi verso una cultura più data-driven.
Per sapere di più delle funzionalità di un Data Catalog, dei benefici che può apportare alle persone che utilizzano i dati, delle modalità progettuali di implementazione, o per condividere esigenze sulla gestione di dati e metadati, ti invitiamo a contattarci.
Francesco Rovesti, Business Analytics Team Leader
Vuoi approfondire temi di Data Governance e Data Strategy?
Esplora anche questi contenuti:
“Data Governance Fundamentals: metodologia, organizzazione e tecnologie” | Accedi all’Area Learning >>
“Vuoi puntare sul Cloud? Assicurati di farlo bene.” | Leggi il Data Answers >>
“Digital Transformation: una roadmap per governare il cambiamento”| Leggi il Data Answers >>