-
Type de la Formation
Formation Présentielle BIG DATA
-
Durée
14 Heures
Les service de base de l’écosystème hadoop (Hdfs, Mapreduce, yarn, Zookeeper)
Cette initiation approfondie aux services fondamentaux de l'écosystème Hadoop offre une plongée complète dans les bases nécessaires pour travailler efficacement avec des données à grande échelle. Vous serez guidé à travers les concepts essentiels de Hadoop, mettant en lumière le pilier fondamental qu'est le Hadoop Distributed File System (HDFS), suivi de YARN, Zookeeper, MapReduce et Tez. Explorez le fonctionnement détaillé de HDFS, incluant la réplication des données et la gestion des pannes. Enfin, vous aurez l'opportunité de mettre en pratique vos connaissances en déployant un cluster Hadoop au cours d'activités pratiques stimulantes
Objectifs pédagogiques
- Configurer et administrer un cluster Hadoop en fournissant une base solide les pour les futurs administrateurs système.
- Acquérir une compréhension approfondie des concepts fondamentaux du stockage distribué (HDFS) et du calcul distribué (MapReduce)
- Optimiser les performances des opérations MapReduce.
- Intégrer Hadoop avec d'autres technologies pour l'ingestion de données en temps réel.
- Mener des projets pratiques impliquant l'écosystème Hadoop.
Durée
- 14 heures
Coût/HT
Public Concerné
- Toute personne intéressée par le Big Data et l'analyse de données à grande échelle
- Développeurs Java débutants et expérimentés.
- Ingénieurs logiciels et administrateurs système.
- Professionnels en reconversion et consultants en IT.
- Étudiants en informatique et chefs de projet techniques.
Prérequis
- Connaissances de base en programmation.
- Familiarité avec Unix/Linux.
- Notions en bases de données et SQL.
- Compréhension des concepts de bases de données distribuées.
- Curiosité et motivation pour le Big Dataà apprendre et à explorer.
Moyens pédagogiques et d’encadrement
- Cours théorique assurés par des formateurs expérimentés
- Support de cours détaillés
- Séries d’exercices et travaux pratiques
- Un pc avec accès à tous les outils nécessaires au cours
Suivi et évaluation des résultats
- Examen écrit
- Compte rendu individuel
- Attestation de présence
- Enquête de de satisfaction
Programme
- Introduction aux services de bases de l’écosystème Hadoop
- * Définitions
- * Yarn
- * Zookeeper
- * Map reduce vs Tez
- HDFS
- * Définitions
- * NameNode
- * DataNode
- * Architecture
- * Réplication
- * Gestion des pannes
- * Zookeeper et interactions avec les NameNode & DataNode
- * Ecriture dans HDFS
- * Lecture Depuis HDFS
- MapReduce
- * Intuition et concept de base
- * MapReduce en action
- TP : Mise en place d'un cluster hadoop (Ambari)
Modalité d’accès
Pour les personnes ayant un handicap, merci de nous contacter afin que l’on puisse s’organiser.
Téléphone : +33 1 85 78 59 63
Courriel : administration@isd-formation.com