4 outils pour améliorer votre stratégie de gestion des données
Dans le monde de la Data, les outils et les nomenclatures se multiplient. On fait souvent référence aux outils de MDM, Data Catalog, Data Portal ou de Data Hub autour des problématiques de gouvernance et de qualité de la donnée. Il est néanmoins difficile de s’y retrouver.
En effet, les principales solutions du marché proposent des fonctionnalités qui se chevauchent et intègrent différents concepts à ne pas confondre. À travers cet article, nos experts vous aident à y voir plus clair grâce à des définitions et concepts clés autour du Data Management.
Un objectif commun : casser les silos, accroitre la qualité et l’accessibilité des données
« Des recherches ont montré que les collaborateurs perdaient jusqu’à 50% de leur temps à rechercher des données, identifier des sources de qualité, corriger des erreurs, pour finalement ne pas leur faire confiance. » Harvard Business Review, 2013
Les utilisateurs de la donnée, tous départements confondus, peinent à accéder aux différentes données de l’entreprise (celles-ci étant stockées en silos), à en assurer la véracité, la qualité et à pouvoir les exploiter.
Quatre outils permettent d’y remédier :
- Le Master Data Management (MDM)
- Le Data Catalog
- Le Data Portal
- Le Data Hub
Master Data Management (MDM)
Le MDM permet une centralisation et une gestion des données de référence. Il désigne également l’ensemble des processus permettant de construire un référentiel de qualité tel que le nettoyage des données, la mise à jour, la cohérence, la consolidation, la suppression des doublons et la définition des données de référence de l’entreprise.
Un MDM est donc un système centralisé de données transverses identifiées comme étant essentielles qui permet de disposer d’une donnée unifiée en termes de définition et de qualité, utilisable par tous les services d’une entreprise.
Parmi ces données, on peut citer les marchés, les employés, les produits, les clients, les assets numériques, les fournisseurs ou encore les magasins. Les données transactionnelles ne font pas partie du périmètre du MDM car il n’y a pas de données « Master » lorsqu’on parle de ventes, de stocks, de prix ou de web Analytics.
Les principaux objectifs du MDM :
- Stocker du contenu afin d’en assurer l’unicité et la durabilité
- Partager à travers tous les départements une vision unique des données « Master »
- Assurer du contenu certifié par les producteurs de la donnée
- Préserver une information organisée et indexée
- Gérer des workflows pour s’assurer que la donnée corresponde aux standards
- Se connecter aux autres systèmes connexes pour leur fournir la donnée « Master »
Les solutions MDM les plus utilisées sont les PIM (Product Information Management), les DAM (Digital Assets Management) et les RCU (Référentiel Client Unique).
De nombreux éditeurs fournissent des solutions reconnues sur le marché : SAP, Informatica, TIBCO, Ataccama, Semarchy, IBM, Talend, Akeneo, Celum, Opentext…
Data Catalog
Le Data Catalog, outil que nous avions abordé dans un article précédent, concentre une documentation de toutes les données de l’entreprise, pas seulement des « Master » Data.
Les objectifs du Data Catalog sont variés :
- Partager une compréhension commune des données
- Avoir un accès centralisé à la donnée, une unique source de vérité
- Contextualiser la donnée
- Identifier et responsabiliser les Data owners
- Démystifier la donnée, la rendre facile d’accès et maximiser les opportunités pour les utilisateurs métiers d’explorer les données
- Réduire les intermédiations entre les Data owners et les acteurs IT
- Contrôler et sécuriser l’accès aux données
Divers éditeurs proposent des solutions de Data Catalog tels que : Talend, Denodo, Microsoft Azure, Informatica, TIBCO, DataGalaxy, Zeenea, Ataccama, Alation, Collibra…
Data Portal
Le Data Portal permet d’exposer des données sous forme de portail à l’instar des portails d’open-data, comme par exemple data.gouv.fr. Les utilisateurs peuvent récupérer leurs jeux de données mis à disposition dans le Data Portal puis les utiliser à leur convenance.
On utilise un Data Hub pour se connecter à l’ensemble des données via un unique point d’accès technique.
À partir de là, les jeux de données disponibles s’affichent via une page web réalisée avec les solutions CKAN ou DKAN.
Data Hub
Un Data Hub consolide les données provenant de sources multiples pour les rendre techniquement accessibles.
Il s’agit d’une architecture logique ou physique qui permet le partage des données en connectant les producteurs de données (applications, processus et équipes) avec les consommateurs de données (autres applications, processus et équipes). Les points de terminaison interagissent avec le Data Hub, y livrent des données ou en reçoivent. Le Data Hub fournit donc un point de médiation, de gouvernance et de visibilité sur la façon dont les données circulent au sein de l’entreprise. Grâce au Data Hub, on évite le fameux « plat de spaghettis », à savoir de multiples connexions point à point entre les appelants et les fournisseurs de données.
Le Data Hub se connecte notamment aux Datawarehouses et Datalakes de l’entreprise, en plus des applications, afin de fournir une seule porte d’entrée technique aux échanges de données.
Divers éditeurs proposent des solutions de Data Hub par exemple : Cloudera, Indexima, Informatica, Semarchy…
Conclusion
Pour conclure, le Data Management, autrement dit la mise en place d’une stratégie de gestion des données au sein d’une entreprise, regroupe l’ensemble des processus qui permettent de collecter, structurer, gérer et utiliser les données.
Il s’appuie sur des outils incontournables tels que le MDM qui permet de partager une source commune de données, le Data Catalog qui permet de partager une compréhension commune des données, le Data Portal qui permet de rendre visible les données, et le Data Hub qui permet une accessibilité des données.
Les concepts autour du Data Management ne sont efficaces que si les individus qui le mettent en œuvre sont identifiés, formés et partagent des objectifs communs. Il est donc primordial de mettre en place en amont une Gouvernance de la Donnée adaptée afin d’optimiser la gestion des données sur le long terme.
Vous avez besoin d’accompagnement sur vos projets de Data Management ou de Data Gouvernance ? Contactez-nous !