Accueil
Formation Big Data
Formation Hadoop
Formation Administrator Training for Apache Hadoop

Formation Administrator Training for Apache Hadoop

Le cours s'adresse aux spécialistes de l'informatique :

Ce cours s'adresse aux spécialistes de l'informatique qui recherchent une solution pour stocker et traiter de grands ensembles de données dans un environnement de système distribué.

Goal :

Connaissance approfondie de l'administration des clusters Hadoop.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Plan du cours

1 : HDFS (17%)

Décrire la fonction des démons HDFS
Décrire le fonctionnement normal d'un cluster Apache Hadoop, tant au niveau du stockage que du traitement des données.
Identifier les caractéristiques actuelles des systèmes informatiques qui motivent un système comme Apache Hadoop.
Classer les principaux objectifs de la conception de HDFS
Compte tenu d'un scénario, identifier le cas d'utilisation approprié pour la fédération HDFS
Identifier les composants et les démons d'un cluster HDFS HA-Quorum
Analyser le rôle de la sécurité HDFS (Kerberos)
Déterminer le meilleur choix de sérialisation des données pour un scénario donné
Décrire les chemins de lecture et d'écriture des fichiers
Identifier les commandes pour manipuler les fichiers dans le Hadoop File System Shell

2 : YARN et MapReduce version 2 (MRv2) (17%)

Comprendre comment la mise à jour d'un cluster de Hadoop 1 à Hadoop 2 affecte les paramètres du cluster
Comprendre comment déployer MapReduce v2 (MRv2 / YARN), y compris tous les démons YARN
Comprendre la stratégie de conception de base pour MapReduce v2 (MRv2)
Déterminer comment YARN gère les allocations de ressources
Identifier le flux de travail d'une tâche MapReduce exécutée sur YARN
Déterminer quels fichiers vous devez modifier et comment afin de migrer un cluster de MapReduce version 1 (MRv1) à MapReduce version 2 (MRv2) fonctionnant sur YARN.

3 : Hadoop Planification du cluster (16%)

Principaux points à prendre en compte dans le choix du matériel et des systèmes d'exploitation pour héberger un cluster Apache Hadoop.
Analyser les choix dans la sélection d'un système d'exploitation
Comprendre le réglage du noyau et l'échange de disques.
Compte tenu d'un scénario et d'une charge de travail, identifier une configuration matérielle adaptée au scénario.
Compte tenu d'un scénario, déterminer les composants de l'écosystème que votre grappe doit exécuter pour respecter l'accord de niveau de service (SLA).
Dimensionnement de la grappe : compte tenu d'un scénario et de la fréquence d'exécution, identifier les spécificités de la charge de travail, y compris l'unité centrale, la mémoire, le stockage, les entrées/sorties de disque.
Dimensionnement et configuration des disques : JBOD ou RAID, SAN, virtualisation et exigences en matière de dimensionnement des disques dans un cluster.
Topologies de réseau : comprendre l'utilisation du réseau dans Hadoop (pour HDFS et MapReduce) et proposer ou identifier les composants clés de la conception du réseau pour un scénario donné.

4 : Hadoop Installation et administration d'un cluster (25%)

A partir d'un scénario, identifier comment le cluster va gérer les pannes de disques et de machines.
Analyser une configuration de journalisation et le format d'un fichier de configuration de journalisation
Comprendre les bases des métriques Hadoop et de la surveillance de l'état des clusters
Identifier la fonction et l'objectif des outils disponibles pour la surveillance des clusters
Être capable d'installer tous les composants de l'écosystème dans CDH 5, y compris (mais sans s'y limiter) : Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive et Pig
Identifier la fonction et l'objectif des outils disponibles pour gérer le système de fichiers Apache Hadoop.

5 : Ressources Management (10%)

Comprendre les objectifs généraux de conception de chacun des ordonnanceurs Hadoop.
A partir d'un scénario, déterminer comment l'ordonnanceur FIFO alloue les ressources d'un cluster
Dans le cadre d'un scénario, déterminer comment l'ordonnanceur Fair Scheduler alloue les ressources des clusters sous YARN
Compte tenu d'un scénario, déterminer comment l'ordonnanceur Capacity Scheduler alloue les ressources du cluster.

6 : Surveillance et journalisation (15%)

Comprendre les fonctions et les caractéristiques des capacités de collecte de métriques de Hadoop.
Analyser les interfaces Web NameNode et JobTracker
Comprendre comment surveiller les Daemons du cluster
Identifier et surveiller l'utilisation du CPU sur les noeuds maîtres
Décrire comment surveiller l'allocation de swap et de mémoire sur tous les nœuds
Identifier comment visualiser et gérer les fichiers journaux de Hadoop.
Interpréter un fichier journal

Pré requis

Compétences de base en administration Linux.
Compétences de base en programmation

35 Heures

Nombre de participants

En ligne

Salle de Classe

Choisir le lieu

Veuillez choisir le lieu souhaité

Prix par Participant

Les formations ouvertes requièrent plus de 3 participants.

Formation Administrator Training for Apache Hadoop - Booking

Nom Complet *

Email *

Téléphone *

Poste

Nom de l'entreprise

Adresse 1 *

Ville *

État / Province

Pays *

Code postal *

Date de début

Numéro d'identification fiscale

Les dates sont soumises à disponibilité et se déroulent entre 09:30 et 16:30.

Paiement *

Virement bancaire (facture, commande)

Carte de débit / Carte de crédit

Commentaires

Autoriser la publication du certificat

Si vous cochez cette case, les participants auront la possibilité de publier leur certificat de réalisation dans le catalogue des professionnels certifiés de NobleProg.

Termes et Conditions *

Je suis un représentant autorisé du client et je souhaite réserver la formation / services conformément aux conditions générales et à la politique de confidentialité de NobleProg.

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Formation Administrator Training for Apache Hadoop - Enquiry

Nom Complet *

Email *

Téléphone *

Nombre de participants

Nom de l'entreprise

Adresse de l'entreprise

Comment souhaitez-vous suivre le cours ?

Locaux Clients

En ligne

Salle de Classe

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Administrator Training for Apache Hadoop - Demande d'informations consulting

Demande d'informations consulting

Nom Complet *

Téléphone *

Email *

Nom de l'entreprise

Sujet du Conseil *

But du Consulting

Durée de la mission de conseil

Nombre de Consultants

Date souhaitée

Avec qui le consultant travaillera?

Agence de Conseil *

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Nos clients témoignent (3)

CA$ 8,784 (En ligne)

CA$ 13,784 (Salle de Classe)

Cours Similaires

Advanced R

14 Heures

Ce cours couvre les sujets avancés de la programmation R.

Algorithmic Trading with Python and R

14 Heures

Cette formation en direct avec instructeur à Canada (en ligne ou sur site) est destinée aux analystes commerciaux qui souhaitent automatiser le commerce avec le trading algorithmique, Python, et R.

A l'issue de cette formation, les participants seront capables de :

Employer des algorithmes pour acheter et vendre rapidement des titres à des incréments spécialisés.
Réduire les coûts associés au commerce en utilisant le trading algorithmique.
Surveiller automatiquement les cours des actions et placer des transactions.

Programming with Big Data in R

21 Heures

Big Data désigne des solutions destinées au stockage et au traitement de grands ensembles de données. Développé par Go Ogle au départ, ces Big Data volumes de Big Data des solutions ont évolué et inspiré d' autres projets similaires, dont beaucoup sont disponibles en open source. R est un langage de programmation populaire dans le secteur financier.

Introductory R (Basic to Intermediate)

14 Heures

Cette formation en direct avec instructeur à Canada (en ligne ou sur place) est destinée aux analystes de données débutants qui souhaitent utiliser la programmation R pour manipuler des données, effectuer des analyses de données de base et créer des visualisations convaincantes pour mieux comprendre.

A l'issue de cette formation, les participants seront capables de :

Comprendre les bases de R Programming.
Appliquer les processus fondamentaux de la science des données.
Créer des représentations visuelles de données.

Cluster Analysis with R and SAS

14 Heures

Cette formation en direct (en ligne ou sur site) s'adresse aux analystes de données qui souhaitent programmer avec R en SAS pour l'analyse de clusters.

A l'issue de cette formation, les participants seront capables de :

Utiliser l'analyse de cluster pour l'exploration de données
Maîtriser la syntaxe R pour les solutions de clustering.
Mettre en œuvre le clustering hiérarchique et non hiérarchique.
Prendre des décisions basées sur les données afin d'améliorer les opérations de l'entreprise.

Data and Analytics - from the ground up

42 Heures

L'analyse des données est un outil crucial pour les entreprises aujourd'hui. Nous nous concentrerons tout au long de la formation sur le développement de compétences pour l'analyse pratique des données. L'objectif est d'aider les délégués à donner des réponses fondées sur des preuves aux questions suivantes :

Que s'est-il passé ?

traiter et analyser des données
produire des visualisations de données informatives

Que va-t-il se passer ?

prévoir les performances futures
évaluer les prévisions

Que devrait-il se passer ?

transformer les données en décisions commerciales fondées sur des preuves
optimiser les processus

Le cours lui-même peut être dispensé en classe pendant 6 jours ou à distance sur une période de plusieurs semaines si vous le souhaitez. Nous pouvons travailler avec vous pour adapter le cours à vos besoins.

Data Analysis with Python, R, Power Query, and Power BI

21 Heures

Cette formation en direct à Canada (en ligne ou sur place) est destinée aux professionnels débutants qui souhaitent nettoyer et analyser des données, faire des projections statistiques et créer des visualisations perspicaces à l'aide de ces outils.

A l'issue de cette formation, les participants seront capables de :

Comprendre les bases de Python, R, Power Query, et Power BI pour l'analyse de données.
Nettoyer et organiser des ensembles de données en utilisant Python et Power Query.
Effectuer des analyses statistiques et des projections avec R.
Créer des tableaux de bord et des rapports professionnels avec Power BI.
Intégrer et analyser efficacement des données provenant de sources multiples.

Data Analytics With R

21 Heures

R est un environnement open source très populaire pour le calcul statistique, l'analyse de données et les graphiques. Ce cours présente le langage de programmation R aux étudiants. Il couvre les principes fondamentaux du langage, les bibliothèques et les concepts avancés, ainsi que l'analyse avancée des données et la création de graphiques à partir de données réelles.

Public

Développeurs / analyse de données

Durée du cours

3 jours

21 Heures

Cette formation en direct avec formateur dans Canada (en ligne ou sur site) s'adresse à toute personne souhaitant apprendre et maîtriser les fondamentaux de l'analyse et du modélisation économétrique.

À la fin de cette formation, les participants seront capables de :

Apprendre et comprendre les fondamentaux de l'économétrie.
Utiliser Eviews et des simulateurs de risque.

HR Analytics for Public Organisations

14 Heures

Cette formation en direct (en ligne ou sur site), dirigée par un instructeur, s'adresse aux professionnels des ressources humaines qui souhaitent utiliser des méthodes analytiques pour améliorer les performances de l'organisation. Ce cours couvre les approches qualitatives et quantitatives, empiriques et statistiques.

Format du cours

Exposé et discussion interactifs.
Beaucoup d'exercices et de pratique.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.

Statistical Analysis using SPSS

21 Heures

Cette formation en direct avec instructeur à Canada (en ligne ou sur site) s'adresse aux professionnels de niveau débutant à intermédiaire qui souhaitent effectuer des analyses statistiques à l'aide de SPSS pour interpréter les données avec précision, exécuter des tests statistiques complexes et générer des informations significatives.

A l'issue de cette formation, les participants seront capables de :

Naviguer dans l'interface de SPSS et gérer efficacement les ensembles de données.
Effectuer des analyses statistiques descriptives et inférentielles.
Effectuer des tests t, ANOVA, MANOVA, des analyses de régression et de corrélation.
Appliquer des tests non paramétriques, l'analyse des composantes principales et l'analyse factorielle pour une interprétation avancée des données.

Talent Acquisition Analytics

14 Heures

Cette formation en direct (en ligne ou sur site) est destinée aux professionnels des ressources humaines et aux spécialistes du recrutement qui souhaitent utiliser des méthodes analytiques pour améliorer les performances de l'organisation. Ce cours couvre les approches qualitatives et quantitatives, empiriques et statistiques.

Format du cours

Exposé et discussion interactifs.
Beaucoup d'exercices et de pratique.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.

Introduction to Data Visualization with Tidyverse and R

7 Heures

Tidyverse est une collection de logiciels R polyvalents destinés au nettoyage, au traitement, à la modélisation et à la visualisation de données. Certains des packages inclus sont: ggplot2, dplyr, tidyr, readr, purrr et tibble.

Dans cette formation en direct animée par un instructeur, les participants apprendront à manipuler et à visualiser des données à l'aide des outils inclus dans Tidyverse .

À la fin de cette formation, les participants seront en mesure de:

Effectuer une analyse des données et créer des visualisations attrayantes
Tirer des conclusions utiles à partir de divers ensembles de données d'échantillons de données
Filtrer, trier et résumer les données pour répondre à des questions exploratoires
Transformez les données traitées en tracés linéaires, en barres et en histogrammes informatifs
Importer et filtrer des données provenant de diverses sources de données, notamment Excel fichiers Excel , CSV et SPSS

Public

Débutants à la langue R
Débutants en analyse et visualisation de données

Format du cours

Partie de conférence, partie de discussion, exercices et exercices intensifs

Formation Administrator Training for Apache Hadoop

Le cours s'adresse aux spécialistes de l'informatique :

Goal :

Plan du cours

1 : HDFS (17%)

2 : YARN et MapReduce version 2 (MRv2) (17%)

3 : Hadoop Planification du cluster (16%)

4 : Hadoop Installation et administration d'un cluster (25%)

5 : Ressources Management (10%)

6 : Surveillance et journalisation (15%)

Pré requis

Nos clients témoignent (3)

Jacek Pieczatka

Formation - Administrator Training for Apache Hadoop

Grzegorz Gorski

Formation - Administrator Training for Apache Hadoop

Simon Hahn

Formation - Administrator Training for Apache Hadoop

Cours à venir

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation Administrator Training for Apache Hadoop

Le cours s'adresse aux spécialistes de l'informatique :

Goal :

Plan du cours

1 : HDFS (17%)

2 : YARN et MapReduce version 2 (MRv2) (17%)

3 : Hadoop Planification du cluster (16%)

4 : Hadoop Installation et administration d'un cluster (25%)

5 : Ressources Management (10%)

6 : Surveillance et journalisation (15%)

Pré requis

Nos clients témoignent (3)

Jacek Pieczatka

Formation - Administrator Training for Apache Hadoop

Grzegorz Gorski

Formation - Administrator Training for Apache Hadoop

Simon Hahn

Formation - Administrator Training for Apache Hadoop

Cours à venir

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Cours Similaires

Advanced R

Algorithmic Trading with Python and R

Programming with Big Data in R

Introductory R (Basic to Intermediate)

Cluster Analysis with R and SAS

Data and Analytics - from the ground up

Que s'est-il passé ?

Que va-t-il se passer ?

Que devrait-il se passer ?

Data Analysis with Python, R, Power Query, and Power BI

Data Analytics With R

Public

Durée du cours

Format

Data Mining with R

Data Mining & Machine Learning avec R

Econometrics: Eviews and Risk Simulator

HR Analytics for Public Organisations

Statistical Analysis using SPSS

Talent Acquisition Analytics

Introduction to Data Visualization with Tidyverse and R

Catégories Similaires

Hadoop

Statistiques

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites