4 strumenti per migliorare la tua strategia di gestione dei dati
Nel mondo dei dati, gli strumenti e le nomenclature sono sempre più numerosi. Ci riferiamo spesso agli strumenti MDM, Data Catalog, Data Portal o Data Hub per le questioni di governance e qualità dei dati. Orientarsi è piuttosto difficile.
Le principali soluzioni sul mercato offrono funzionalità sovrapposte e integrano diversi concetti che non vanno confusi. In questo articolo, i nostri esperti vi aiuteranno a vederci più chiaro con definizioni e concetti chiave relativi al Data Management.
UN OBIETTIVO COMUNE: ROMPERE I SILOS, AUMENTARE LA QUALITÀ E L’ACCESSIBILITÀ DEI DATI :
« La ricerca dimostra che i dipendenti sprecano fino al 50% del loro tempo per cercare i dati, identificare fonti di qualità, correggere gli errori, per poi non fidarsi. » Harvard Business Review, 2013
Gli utilizzatori di dati in tutti i settori hanno difficoltà ad accedere ai vari dati dell’azienda (che sono immagazzinati in silos), a verificarne la veridicità, la qualità e l’utilizzazione.
Abbiamo quattro strumenti per affrontare questo problema:
- Il Master Data Management (MDM)
- Il Data Catalog
- Il Data Portal
- Il Data Hub
MASTER DATA MANAGEMENT (MDM) :
Il MDM permette la centralizzazione e la gestione dei dati master. Si riferisce anche a tutti i processi coinvolti nella costruzione di un repository di qualità, come la pulizia dei dati, l’aggiornamento, la coerenza, il consolidamento, la rimozione dei duplicati e la definizione dei dati master aziendali.
Un MDM è quindi un sistema centralizzato di dati trasversali identificati come essenziali, che permette di avere dati unificati in termini di definizione e qualità, utilizzabili da tutti i dipartimenti di un’azienda.
Tra questi dati troviamo i mercati, i dipendenti, i prodotti, i clienti, i beni digitali, i fornitori e i negozi. I dati transazionali non fanno parte dell’ambito MDM perché non ci sono dati “master” quando si tratta di vendite, inventario, prezzi o analisi web.
I principali obiettivi del MDM:
- Conservare i contenuti per garantirne l’unicità e la sostenibilità
- Condividere un’unica visione dei dati master in tutti i dipartimenti
- Garantire contenuti certificati dai produttori di dati
- Conservare informazioni organizzate e indicizzate
- Gestire i flussi di lavoro per garantire che i dati soddisfino gli standard
- Collegarsi ad altri sistemi correlati per fornire loro i dati maste
Le soluzioni MDM più utilizzate sono PIM (Product Information Management), DAM (Digital Assets Management) e RCU (Référentiel Client Unique). Numerosi editori forniscono soluzioni riconosciute sul mercato: SAP, Informatica, TIBCO, Ataccama, Semarchy, IBM, Talend, Akeneo, Celum, Opentext…
DATA CATALOG :
Il Data Catalog, si concentra sulla documentazione di tutti i dati dell’azienda, quindi non solo i dati master.
Gli obiettivi del Data Catalog sono vari:
- Conservare i contenuti per garantirne l’unicità e la sostenibilità
- Condividere una comprensione comune dei dati
- Avere un accesso centralizzato ai dati, una singola fonte di verità
- Contestualizzare i dati
- Identificare e responsabilizzare i data owner
- Demistificare i dati, renderli facilmente accessibili e massimizzare le opportunità per gli utenti aziendali di esplorare i dati
- Ridurre l’intermediazione tra i proprietari dei dati e gli attori IT
- Controllo e accesso sicuro ai dati.
Vari editori offrono soluzioni di catalogo dati come: Talend, Denodo, Microsoft Azure, Informatica, TIBCO, DataGalaxy, Zeenea, Ataccama, Alation, Collibra…
DATA PORTAL :
Il Data Portal permette di esporre i dati nel formato di un portale simile ai portali open-data, come dati.gov.it. Gli utenti possono recuperare i loro set di dati dal Data Portal e usarli come desiderano.
Viene utilizzato un Data Hub per connettersi al set di dati attraverso un unico punto di accesso tecnico.
Da lì, i set di dati disponibili vengono visualizzati tramite una pagina web realizzata con le soluzioni CKAN o DKAN.
DATA HUB :
Un Data Hub consolida i dati da più fonti per renderli tecnicamente accessibili.
È un’architettura logica o fisica che permette la condivisione dei dati collegando i produttori di dati (applicazioni, processi e team) con i consumatori (altre applicazioni, processi e team). Gli endpoint interagiscono con il Data Hub, fornendo dati o ricevendo dati da esso. Il Data Hub fornisce quindi un punto di mediazione, governance e visibilità su come i dati fluiscono all’interno dell’azienda. Evita il cosiddetto “groviglio” di connessioni multiple punto-punto tra i chiamanti e i fornitori di dati.
Il Data Hub si collega in particolare ai datawarehouse e ai datalake dell’azienda, oltre alle applicazioni, al fine di fornire un unico punto di ingresso tecnico per gli scambi di dati.
Vari editori offrono soluzioni Data Hub, ad esempio: Cloudera, Indexima, Informatica, Semarchy…
CONCLUSIONE :
In conclusione, il Data Management, ovvero l’implementazione di una strategia di gestione dei dati in un’azienda, riunisce tutti i processi che permettono di raccogliere, strutturare, gestire e utilizzare i dati.
Si basa su strumenti essenziali come l’MDM, che permette di condividere una fonte comune di dati, il Data Catalog, che consente una comprensione comune dei dati da condividere, il Data Portal, che permette di rendere visibili i dati, e il Data Hub, che rende possibile l’accesso ai dati.
I concetti intorno al Data Management sono efficaci solo se gli individui che li implementano sono identificati, formati e condividono degli obiettivi comuni. È quindi essenziale mettere in atto un adeguato sistema di Data Governance per ottimizzare la gestione dei dati a lungo termine.
Avete bisogno di supporto per i vostri progetti di Data Management o Data Governance?