Actualités

Démêlez vos spaghettis de données (sept. 2022)

Depuis que nous avons lancé notre activité chez CROPLAND, en 2013, nous avons vu de nombreuses citations célèbres sur le big data, l’analyse de données ou les données en général. Voici quelques-unes de nos préférées :

« Les données sont le nouveau pétrole… »
« En Dieu nous croyons, tous les autres doivent apporter des données »
« Si le contenu est roi, alors les données sont King Kong »
« Les données sont la nouvelle science, le big data détient la réponse »
« Sans données, vous n’êtes qu’une personne de plus avec une opinion »

Aujourd’hui, en 2020, l’analyse de données et, au sens large, la prise de décision fondée sur les données deviennent de plus en plus courantes dans le monde des affaires ; dans certaines organisations, elles ont même été complètement intégrées dans leurs opérations quotidiennes.
Dans de telles situations, il n’est pas rare que les gens se retournent et disent « Eh bien… mission accomplie » ou « On y est allé, on l’a fait… et on a le t-shirt. En fait, nous devrions être heureux d’avoir atteint cette étape, non ? »
Eh bien, cette explosion de données présente également un inconvénient potentiel… et nous, chez CROPLAND, appelons cela les spaghettis de données. « Pardon, les spaghettis de données ? »
En effet, presque tous les processus opérationnels dans les entreprises sont aujourd’hui numérisés. Cette situation offre de nombreuses opportunités pour des analyses approfondies et détaillées. De nos jours, presque tous les systèmes permettent à un utilisateur d’exporter des données ou des rapports au format csv ou autres formats texte. De nombreux analystes et responsables fonctionnels ont commencé à consolider ces sources d’information et à effectuer ce que nous appelons des analyses déconnectées.
L’outil LE plus fréquemment utilisé pour de telles analyses est Microsoft Excel… et c’est là que les spaghettis commencent.

« Il y a plus de feuilles Excel sur l’ordinateur portable d’un manager qu’il n’y a de fils de spaghetti dans une bonne bolognaise. »

Pas de tomates, pas de vraie bolognaise. Pas d’Excel, pas de spaghettis de données

Microsoft a rendu terriblement facile l’intégration de données dans Excel ; des plug-ins ou outils supplémentaires comme PowerQuery permettent même aux utilisateurs de programmer des opérations ETL (Extract Transfer Load), sans avoir à contacter des administrateurs de bases de données ou des développeurs de haut niveau. Avec l’introduction de PowerBI, nous avons vu cette évolution s’étendre, voire exploser.
Les outils ne sont cependant pas le problème, c’est la façon dont on les utilise. Beaucoup, sinon toutes, les opérations de données dans ces outils ont tendance à être consécutives ; elles contiennent également des liens (codés en dur), des hypothèses et des références fixes à d’autres ensembles de données temporaires.

Quelques exemples :
* Avez-vous déjà rencontré des fonctions RECHERCHEV qui n’ont pas été copiées jusqu’au bas d’un tableau mis à jour ?
* Avez-vous déjà dû mettre à jour un fichier avec une référence à un fichier source qui semble avoir disparu ?
* Avez-vous déjà oublié de mettre à jour la référence de tableau dans l’un de vos tableaux croisés dynamiques ?


Ce qui se passe, c’est que les données elles-mêmes sont téléchargées ou générées dans l’un des systèmes TIC bien établis (bases de données), mais que les analyses (et donc aussi les connaissances) sont réparties dans plusieurs feuilles Excel différentes (versions) au sein de l’organisation. Tout va bien, jusqu’à ce que quelqu’un vous demande de lui envoyer « la dernière version du plan d’affaires ».
Si cela vous semble familier, nous comprenons votre douleur.

Où en êtes-vous dans votre parcours de données ?

Souvent, nous constatons qu’à mesure que la quantité de données dans l’organisation augmente, la qualité de la prise de décision augmente également. C’est-à-dire, jusqu’à ce qu’un point de bascule soit atteint, et que la qualité de la prise de décision diminue en réalité… en raison des spaghettis de données.
Dans de telles situations, les managers et les analystes sont souvent confrontés aux problèmes suivants :

1. Comment garantir une seule version de la vérité ?
Deux personnes différentes exploitant le même ensemble de données peuvent aboutir à des conclusions différentes.

2. Comment garantir la qualité des informations et des analyses ?
Les tests sont un talent souvent oublié et il est très difficile de détecter ses propres erreurs, alors comment résoudre ce problème ?

3. Comment rendre nos analyses durables ?
De nombreuses analyses partent d’une idée ou d’une question soulevée par un manager, mais la clé est de les rendre durables dans le temps. Comment assurer la continuité ?

4. Quel est le degré de sophistication de mes analyses de données ?
Bien que les outils (Microsoft) d’aujourd’hui soient très puissants, ils ont aussi leurs limites. Certaines analyses (prédictives) avancées ne sont tout simplement pas possibles ; que faire si vous souhaitez découvrir le véritable potentiel de vos données (avec la science des données ou l’I.A.) ?

La solution
La solution : une stratégie de données efficace. En mettant en œuvre une stratégie de données efficace dans votre organisation, vous pouvez vraiment commencer à récolter les fruits de l’augmentation explosive des données que nous avons connue au cours de la dernière décennie.

Donc, si vous êtes un manager qui souhaite une seule version de la vérité basée sur un reporting efficace pouvant englober des logiques complexes, si vous êtes un manager qui souhaite exploiter tout le potentiel de ses données et découvrir la puissance de l’Intelligence Artificielle… alors contactez-nous.

Curieux de savoir ce que l'I.A. peut faire
pour votre entreprise ?

Découvrez comment vous pouvez commencer à bénéficier de l'I.A. lors d'une session gratuite d'échange sur l'I.A.

En savoir plus sur ce sujet

Blog
Management, Opérations
Le navigateur n'est plus une simple interface passive : il est devenu un véritable exécutant...