Plan du cours

Introduction à Google Colab et Apache Spark (en anglais)

  • Aperçu de Google Colab
  • Introduction à Apache Spark
  • Configuration de Spark dans Google Colab

Traitement des données avec Apache Spark

  • Travailler avec des RDD et des DataFrames
  • Chargement et traitement de grands ensembles de données
  • Utiliser Spark SQL pour interroger des données structurées

Analyse avancée avec Spark

  • Apprentissage automatique avec Spark MLlib
  • Effectuer des analyses de données en temps réel
  • Calcul distribué avec Spark

Visualisation et Collaboration dans Google Colab

  • Intégration de Colab avec des bibliothèques de visualisation populaires
  • Flux de travail collaboratifs avec les carnets de notes Colab
  • Partage et exportation des résultats

Optimiser Big Data les flux de travail

  • Optimiser les performances de Spark
  • Optimisation de l'utilisation de la mémoire et du stockage
  • Mise à l'échelle des flux de travail pour les grands ensembles de données

Big Data dans le Cloud

  • Intégrer Google Colab avec des outils basés sur le cloud
  • Utiliser le stockage en nuage pour les données volumineuses
  • Travailler avec Spark dans des environnements cloud distribués

Études de cas et meilleures pratiques

  • Examen des applications big data du monde réel
  • Études de cas utilisant Apache Spark et Colab
  • Meilleures pratiques pour l'analyse des big data

Résumé et prochaines étapes

Pré requis

  • Connaissance de base des concepts de la science des données
  • Familiarité avec Apache Spark
  • Python compétences en programmation

Public

  • Scientifiques des données
  • Ingénieurs en données
  • Chercheurs travaillant avec des données massives (big data)
 14 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires