Comprendre les concepts clés et les enjeux du Big Data
- Les origines du Big Data.
- La valeur de la donnée : un changement d'importance.
- La donnée en tant que matière première.
- Les chiffres clés du marché dans le monde et en France.
- Les enjeux du Big Data : ROI, organisation, confidentialité des données.
Démonstration
Présentation d'une architecture Big Data.
Technologies du Big Data
- Architecture et composants de la plateforme Hadoop 2.
- Les modes de stockage (NoSQL, HDFS).
- Fonctionnement de MapReduce et Yarn...
- Principales distributions Hadoop : Hortonworks, Cloudera, MapR...
- Les technologies : Spark, Storm, Databrick, Machine Learning Azure...
- Démarche d'installation d'une plateforme Hadoop.
- Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview...).
Démonstration
Installation d'une plateforme Big Data complète.
Traitement des données Big Data
- Fonctionnement de Hadoop Distributed File System (HDFS).
- Importer des données vers HDFS.
- Traitement des données avec PIG.
- Requêtes SQL avec HIVE.
- Création de flux de données massives avec un ETL.
Démonstration
Implémentation de flux de données massives.
Méthodes d'analyse et traitements des données pour le Big Data
- Les méthodes d'exploration.
- Segmentation et classification.
- Machine Learning, estimation et prédiction.
- Le temps réel, l'IA.
- L'implémentation des modèles.
Démonstration
Présentation de l'environnement Spark, Jupyter Notebook, R Notebook et Shiny. Mise en place d'analyses de Machine Learning avec le langage R, Python et Scala.
Data Visualisation, représenter des données de façon visuelle
- Principales solutions du marché.
- Aller au-delà des rapports statiques.
- La Data Visualisation et l'art de raconter des chiffres de manière créative et ludique.
- Mesurer l'e-réputation, la notoriété d'une marque, l'expérience et la satisfaction clients...
Démonstration
Présentation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.
Conclusion
- Les conditions du succès.
- Synthèse des meilleures pratiques.
- Bibliographie.