Comment les entreprises maîtrisent l'entrée dans le Big Data
Si une entreprise veut réussir à mettre en œuvre le thème des Big Data, elle doit d'abord développer des scénarios d'application ; ensuite, elle doit exploiter les sources de données nécessaires et enfin, elle doit exploiter les données à l'aide d'un mélange d'outils.
Face à une concurrence agressive, seules les entreprises qui réagissent rapidement à l'actualité du marché peuvent survivre. Les entreprises qui utilisent le big data comme source d'information sont particulièrement efficaces dans ce domaine.
Les bases de données atteignent leurs limites
Les Big Data englobent des données provenant de différentes sources, disponibles dans différents formats et actualisées en permanence. Les moyens conventionnels ne permettent toutefois guère de les traiter pour obtenir des résultats utilisables : les bases de données relationnelles échouent ainsi à cause du volume de données et les processus ETL sont trop lents et ont des difficultés avec les multiples formats de données. La complexité des données ne peut donc être gérée efficacement que par l'utilisation de technologies Big Data spécifiques.
Les données aident à améliorer les processus commerciaux
L'entrée dans le traitement des Big Data commence toujours par des scénarios sur la manière dont les données peuvent aider à améliorer les processus commerciaux ou à modifier les modèles commerciaux. Une fois les projets identifiés, il faut déterminer si toutes les informations nécessaires sont disponibles. Si ce n'est pas le cas, il s'agit de puiser dans de nouvelles sources de données - par exemple les newsletters, les pages de renvoi, les médias sociaux, Google Analytics ou les portails en ligne et les bases de données.
Maintenant, les données peuvent être préparées, analysées et représentées graphiquement à l'aide d'outils. Mais il n'existe pas d'outil qui englobe toutes les fonctions. Seule la combinaison de différentes solutions permet de s'adapter aux besoins individuels.
Cinq conseils pour les projets Big Data :
- Les chefs de service et les spécialistes définissent les résultats à atteindre.
- Les expériences sur les données révèlent des corrélations intéressantes, ce qui permet de faire de nouvelles découvertes.
- Les données peuvent être préparées avec des métadonnées sans adapter la source de données.
- La traçabilité des modèles de données devrait être garantie à tout moment.
- Utiliser les technologies de big data disponibles plutôt que de développer ses propres solutions.
L'auteur : Cyrill Durrer est Data Scientist chez Oyatec à Lommis, Suisse