Plan du cours
Introduction à Apache Spark
- Le rôle de Spark dans le traitement des big data
- L'architecture de Spark et ses composants
Mise en place Apache Spark
- Exigences matérielles et logicielles
- Procédures d'installation en mode autonome et en mode cluster
- Meilleures pratiques de configuration pour les administrateurs système
Administration des clusters Spark
- Outils et techniques de gestion des clusters
- Surveillance des applications Spark et des ressources du cluster
- Configurations de sécurité et gestion des utilisateurs
Optimisation des performances
- Allocation des ressources et planification
- Optimisation des performances de Spark
- Identifier et résoudre les goulots d'étranglement courants
Dépannage et résolution de problèmes
- Défis courants de l'administration de Spark
- Outils de diagnostic et techniques de dépannage
- Approche étape par étape pour résoudre les problèmes courants
- Meilleures pratiques pour maintenir un environnement Spark sain
Sujets relatifs à l'administration avancée
- Intégration avec d'autres outils big data
- Assurer la haute disponibilité et la reprise après sinistre
- Mise à jour et mise à l'échelle des clusters Spark
Résumé et prochaines étapes
Pré requis
- Connaissance de base de la configuration et de la gestion des réseaux
- Familiarité avec le système d'exploitation Linux et l'interface de ligne de commande
- Intérêt pour l'apprentissage des systèmes informatiques distribués et de la gestion des données massives (big data)
Public
- Administrateurs système
Nos clients témoignent (5)
Beaucoup d'exemples pratiques, différentes façons d'aborder le même problème, et parfois des astuces pas si évidentes pour améliorer la solution actuelle.
Rafal - Nordea
Formation - Apache Spark MLlib
Traduction automatique
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique