Plan du cours
Introduction à Google Colab et Apache Spark (en anglais)
- Aperçu de Google Colab
- Introduction à Apache Spark
- Configuration de Spark dans Google Colab
Traitement des données avec Apache Spark
- Travailler avec des RDD et des DataFrames
- Chargement et traitement de grands ensembles de données
- Utiliser Spark SQL pour interroger des données structurées
Analyse avancée avec Spark
- Apprentissage automatique avec Spark MLlib
- Effectuer des analyses de données en temps réel
- Calcul distribué avec Spark
Visualisation et Collaboration dans Google Colab
- Intégration de Colab avec des bibliothèques de visualisation populaires
- Flux de travail collaboratifs avec les carnets de notes Colab
- Partage et exportation des résultats
Optimiser Big Data les flux de travail
- Optimiser les performances de Spark
- Optimisation de l'utilisation de la mémoire et du stockage
- Mise à l'échelle des flux de travail pour les grands ensembles de données
Big Data dans le Cloud
- Intégrer Google Colab avec des outils basés sur le cloud
- Utiliser le stockage en nuage pour les données volumineuses
- Travailler avec Spark dans des environnements cloud distribués
Études de cas et meilleures pratiques
- Examen des applications big data du monde réel
- Études de cas utilisant Apache Spark et Colab
- Meilleures pratiques pour l'analyse des big data
Résumé et prochaines étapes
Pré requis
- Connaissance de base des concepts de la science des données
- Familiarité avec Apache Spark
- Python compétences en programmation
Public
- Scientifiques des données
- Ingénieurs en données
- Chercheurs travaillant avec des données massives (big data)
Nos clients témoignent (5)
Les exemples pratiques nous ont permis de ressentir réellement comment le programme fonctionne. Des explications détaillées et une intégration des concepts théoriques et leur relation avec les applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique
Rapide et efficace VM Azure et support au top
Tom Leonard - Civadis
Formation - Automated Monitoring with Zabbix
Tous les sujets qu'il a abordés, y compris des exemples. Et également expliqué comment ils sont utiles dans notre travail quotidien.
madduri madduri - Boskalis Singapore Pte Ltd
Formation - QGIS for Geographic Information System
Traduction automatique
J'ai aimé le style de Pablo, le fait qu'il couvre beaucoup de sujets, de la conception de rapports, la personnalisation avec html à l'implémentation d'algortithmes ML simples. [L'équilibre entre les informations théoriques et les exercices. Pablo a vraiment couvert tous les sujets qui m'intéressaient et a donné des réponses complètes à mes questions.
Cristian Tudose - SC Automobile Dacia SA
Formation - Advanced Data Analysis with TIBCO Spotfire
Traduction automatique
Application pratique de Spotfire et toutes les fonctions de base.
Michael Capili - STMicroelectronics, Inc.
Formation - Introduction to Spotfire
Traduction automatique