Conseils pour structurer un projet Big Data

Le lancement d’un projet Big Data au sein d’une entreprise est loin d’être une opération anodine et n’en reste pas moins difficile. Les experts attribuent la structuration du projet principalement à l’organisation, mais celle-ci doit être obligatoirement accompagnée de l’exploitation d’un large éventail de techniques dont les méthodologies sont ancrées sur des référentiels connus.

Cerner les cas d’usages

Le démarrage d’un projet Big Data impose premièrement l’identification des cas d’usages. Cet enjeu implique notamment la sensibilisation des acteurs provenant de divers horizons ainsi qu’une technologie apte à développer de la maturité sur le sujet. La mise en place d’ateliers collectifs avec la présence d’un sponsor interne favorisera les échanges d’idées, besoins et données de chacun, ce qui fera en plus émerger les usages prioritaires tout en défendant l’intérêt du projet.

Le recensement et qualification des données (internes ou externes) avec l’identification de leurs sources pourront ainsi déterminer si les usages présélectionnés sont adaptés. La nature de ces dernières devra d’ailleurs identifier directement les acteurs habilités à les interpréter et les exploiter.

Ré-exploiter les méthodes

Le Big Data est basé sur une série de données volumineuse structurée ou non et garantit toutefois une vitesse de traitement importante. Étant similaire à la fouille de données (Data Mining), celui-ci requiert la coopération entre les différents experts techniques et métiers. La mise en place d’un tableau de bord en parallèle de ce processus donnera la possibilité d’établir des indicateurs de performances et nécessitera un minimum de ressources durant le traitement.

Les démarches Agiles contiennent, quant à elles, les principes capables de répondre aux besoins d’analyse de données. Bien qu’initialement utilisés sur le développement de logiciels, ces derniers sont susceptibles de délivrer une meilleure guidance à travers l’utilisation des variantes de méthodes disponibles (AgileKDD, AABA, Stampede, etc.).

En associant les méthodes agiles avec le suivi de l’évolution du projet, cette combinaison sera en mesure de maintenir le projet vers le résultat visé. Les outils seront également diversifiés pour la gestion de maturité et plusieurs guides ont été publiés afin d’identifier les facteurs de succès à l’avance.

Créer une plateforme

Les plateformes de chaque Big Data sont différentes, en effet, l’architecture et les composants sont établis selon plusieurs paramètres. Les besoins du client demeurent toutefois le facteur dominant, et les outils utilisés devront donc être appropriés pour une collecte rapide de données. Le choix des infrastructures de stockage, d’analyse et de traitement des données feront par ailleurs l’objet de brainstorming, car ces étapes représentent la clé de voûte du projet.

Il faut enfin noter qu’une bonne restitution des informations vis-à-vis des utilisateurs fera facilement passer le projet au niveau supérieur dès lors que les bénéfices associés sont confirmés. L’implémentation d’une bonne gouvernance est cependant recommandée pour garantir la prise en charge des exigences et la gestion des obstacles avant le déploiement à grande échelle.

L’insight as a aservice, qu’est-ce que c’est ?
En quoi consiste le machine learning ?