Explorez l'univers expansif du Big Data et plongez dans les fondements, l'histoire, les caractéristiques clés, et les défis de ce domaine en constante évolution. Rencontrez Hadoop, un acteur central, découvrez la scalabilité, la tolérance aux pannes, et explorez les multiples cas d'usage, du marketing à la sécurité publique. En parallèle, ce cours vous fournit les bases pour travailler avec des données à grande échelle, en vous enseignant les concepts essentiels de l'écosystème Hadoop, de YARN à MapReduce, avec une opportunité pratique de déployer un cluster Hadoop. Préparez-vous à un voyage passionnant au cœur de l'innovation et de la prise de décision dans le monde du Big Data.
Objectifs pédagogiques
- Configurer et administrer un cluster Hadoop en fournissant une base solide les pour les futurs administrateurs système.
- Acquérir une compréhension approfondie des concepts fondamentaux du stockage distribué (HDFS) et du calcul distribué (MapReduce)
- Optimiser les performances des opérations MapReduce.
- Intégrer Hadoop avec d'autres technologies pour l'ingestion de données en temps réel.
- Mener des projets pratiques impliquant l'écosystème Hadoop.
Durée
Cout/HT
Prérequis
- Connaissances de base en programmation.
- Familiarité avec Unix/Linux.
- Notions en bases de données et SQL.
- Compréhension des concepts de bases de données distribuées.
- Curiosité et motivation pour le Big Dataà apprendre et à explorer.
Moyens pédagogiques et d’encadrement
- Cours théorique assurés par des formateurs expérimentés
- Support de cours détaillés
- Séries d’exercices et travaux pratiques
- Un pc avec accès à tous les outils nécessaires au cours
Suivi et évaluation des résultats
- Examen écrit
- Compte rendu individuel
- Attestation de présence
- Enquête de de satisfaction
Programme
- I. Introduction Big Data
- Histoire du Big Data
- Les 3 V
- Les 5 V
- Les buts
- Motivations
- Quelques défis :
- Scalabilité :
- Scalabilité verticale
- Scalabilité horizontale
- Tolérance aux pannes :
- Matériels
- Indisponibilité de ressources
- Répondre à la tolérance aux pannes :
- Rencontre avec Hadoop
- Ecosystème Hadoop
- Les Use cases :
- Marketing
- Analyse de tweets
- Le Sport
- La sécurité publique
- II. Introduction aux services de bases de l’écosystème Hadoop
- Définitions
- Yarn
- Zookeeper
- Map reduce vs Tez
- HDFS
- Définitions
- NameNode
- DataNode
- Architecture
- Réplication
- Gestion des pannes
- Zookeeper et interactions avec les NameNode & DataNode
- Ecriture dans HDFS
- Lecture Depuis HDFS
- MapReduce
- Intuition et concept de base
- MapReduce en action
- TP : Mise en place d'un cluster hadoop (Ambari)
Modalité d’accès
Notre organisme de formation veille que toute personne en situation de handicap puisse accéder à nos formations dans la mesure des moyens d’adaptation organisationnels et techniques pouvant être mis en œuvre pour l’accompagner.
Programme de la Formation