Plan du cours
Introduction
- Apache Spark vs Hadoop MapReduce
Vue d'ensemble des caractéristiques et de l'architecture de Apache Spark.
Choix d'une langue Programming
Mise en place Apache Spark
Création d'un exemple d'application
Choix de l'ensemble des données
Exécution Data Analysis sur les données
Traitement des données structurées avec Spark SQL
Traitement des données en continu avec Spark Streaming
Intégration d'Apache Spark avec les outils de la 3ème partie Machine Learning.
Utilisation de Apache Spark pour le traitement graphique
Optimiser Apache Spark
Dépannage
Résumé et conclusion
Pré requis
- Expérience de la ligne de commande Linux
- Compréhension générale du traitement des données
- Expérience de la programmation avec Java, Scala, Python ou R
Audience
- Développeurs
Nos clients témoignent (5)
Beaucoup d'exemples pratiques, différentes façons d'aborder le même problème, et parfois des astuces pas si évidentes pour améliorer la solution actuelle.
Rafal - Nordea
Formation - Apache Spark MLlib
Traduction automatique
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique