Formation Jupyter for Data Science Teams
Jupyter est un IDE interactif et un environnement informatique à code source ouvert, basé sur le web.
Cette formation en direct (en ligne ou sur site) présente l'idée du développement collaboratif en science des données et montre comment utiliser Jupyter pour suivre et participer en tant qu'équipe au "cycle de vie d'une idée informatique". Elle accompagne les participants dans la création d'un exemple de projet de science des données basé sur l'écosystème Jupyter.
A la fin de cette formation, les participants seront capables de :
- Installer et configurer Jupyter, y compris la création et l'intégration d'un dépôt d'équipe sur Git.
- Utiliser les fonctionnalités de Jupyter telles que les extensions, les widgets interactifs, le mode multi-utilisateurs et plus encore pour permettre la collaboration au sein d'un projet.
- Créer, partager et organiser des Notebooks Jupyter avec les membres de l'équipe.
- Choisir parmi Scala, Python, R, pour écrire et exécuter du code contre des systèmes de big data tels que Apache Spark, le tout à travers l'interface Jupyter.
Format du cours
- Exposé et discussion interactifs.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement live-lab.
Options de personnalisation du cours
- Le Jupyter Notebook supporte plus de 40 langages dont R, Python, Scala, Julia, etc. Pour adapter ce cours au(x) langage(s) de votre choix, veuillez nous contacter.
Plan du cours
Introduction à Jupyter
- Présentation de Jupyter et de son écosystème
- Installation et configuration
- Configurer Jupyter pour la collaboration en équipe
Fonctionnalités de collaboration
- Utilisation de Git pour le contrôle de version
- Extensions et widgets interactifs
- Mode multi-utilisateurs
Création et gestion des blocs-notes
- Structure et fonctionnalité des carnets de notes
- Partage et organisation des carnets de notes
- Meilleures pratiques de collaboration
Programming avec Jupyter
- Choisir et utiliser des langages de programmation (Python, R, Scala)
- Écrire et exécuter du code
- Intégration avec les systèmes big data (Apache Spark)
Fonctionnalités avancées de Jupyter
- Personnaliser l'environnement Jupyter
- Automatiser les flux de travail avec Jupyter
- Explorer les cas d'utilisation avancés
Sessions pratiques
- Laboratoires pratiques
- Projets de science des données dans le monde réel
- Exercices de groupe et évaluations par les pairs
Résumé et prochaines étapes
Pré requis
- Une expérience de Programming dans des langages tels que Python, R, Scala, etc.
- Une formation en science des données
Audience
- Équipes de science des données
Les formations ouvertes requièrent plus de 3 participants.
Formation Jupyter for Data Science Teams - Booking
Formation Jupyter for Data Science Teams - Enquiry
Jupyter for Data Science Teams - Demande d'informations consulting
Demande d'informations consulting
Nos clients témoignent (1)
C'est formidable que le cours soit personnalisé aux domaines clés que j'ai soulignés dans le questionnaire préparatoire. Cela aide vraiment à répondre à mes questions sur le sujet et à me conformer à mes objectifs d'apprentissage.
Winnie Chan - Statistics Canada
Formation - Jupyter for Data Science Teams
Traduction automatique
Cours à venir
Cours Similaires
Introduction to Data Science and AI using Python
35 HeuresIl s'agit d'une introduction de 5 jours à Data Science et à l'IA.
Le cours est livré avec des exemples et des exercices utilisant Python
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 HeuresCette formation en Canada (en ligne ou sur site) est destinée aux participants de niveau intermédiaire qui souhaitent automatiser et gérer les flux de travail d'apprentissage automatique, y compris la formation, la validation et le déploiement des modèles à l'aide de Apache Airflow.
A la fin de cette formation, les participants seront capables de :
- Configurer Apache Airflow pour l'orchestration de flux de travail d'apprentissage automatique.
- Automatiser le prétraitement des données, l'entraînement des modèles et les tâches de validation.
- Intégrer Airflow avec des frameworks et des outils d'apprentissage automatique.
- Déployer des modèles d'apprentissage automatique en utilisant des pipelines automatisés.
- Contrôler et optimiser les workflows d'apprentissage automatique en production.
Anaconda Ecosystem for Data Scientists
14 HeuresCette formation en direct avec instructeur en Canada (en ligne ou sur site) s'adresse aux data scientists qui souhaitent utiliser l'écosystème Anaconda pour capturer, gérer et déployer des packages et des workflows d'analyse de données dans une plateforme unique.
A la fin de cette formation, les participants seront capables de :
- Installer et configurer les composants et les bibliothèques Anaconda.
- Comprendre les concepts de base, les fonctionnalités et les avantages de Anaconda.
- Gérer les paquets, les environnements et les canaux à l'aide du Anaconda Navigator.
- Utiliser Conda, R et les paquets Python pour la science des données et l'apprentissage automatique.
- Connaître des cas d'utilisation pratiques et des techniques pour gérer des environnements de données multiples.
AWS Cloud9 for Data Science
28 HeuresCette formation en direct avec instructeur à Canada (en ligne ou sur site) est destinée aux data scientists et analystes de niveau intermédiaire qui souhaitent utiliser AWS Cloud9 pour rationaliser les flux de travail de la science des données.
A l'issue de cette formation, les participants seront en mesure de :
- Configurer un environnement de science des données dans AWS Cloud9.
- Effectuer des analyses de données à l'aide de Python, R et Jupyter Notebook dans Cloud9.
- Intégrer AWS Cloud9 avec les services de données AWS comme S3, RDS et Redshift.
- Utiliser AWS Cloud9 pour le développement et le déploiement de modèles d'apprentissage automatique.
- Optimiser les flux de travail basés sur le cloud pour l'analyse et le traitement des données.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 HeuresRésumé
Les fournisseurs de services (CSP) sont confrontés à une pression pour réduire les coûts et maximiser le revenu moyen par utilisateur (ARPU), tout en assurant une excellente expérience client, mais les volumes de données continuent de croître. Le trafic mondial de données mobiles va croître à un taux de croissance annuel combiné (CAGR) de 78 % à 2016, atteignant 10,8 exabytes par mois.
Pendant ce temps, les CSP génèrent de grands volumes de données, y compris les enregistrements détaillés des appels (CDR), les données réseau et les données client. Les entreprises qui exploitent pleinement ces données gagnent une limite concurrentielle. Selon une récente enquête de The Economist Intelligence Unit, les entreprises qui utilisent la prise de décision basée sur les données bénéficient d’une augmentation de productivité de 5-6%. Cependant, 53% des entreprises n’utilisent que la moitié de leurs données précieuses, et un quart des répondants a noté que de vastes quantités de données utiles ne sont pas utilisées. Les volumes de données sont si élevés que l'analyse manuelle est impossible, et la plupart des systèmes logiciels héréditaires ne peuvent pas se maintenir, ce qui entraîne que les données précieuses sont déchirées ou ignorées.
Avec Big Data & Analytics’ logiciel de big data à grande vitesse, scalable, les CSPs peuvent miner tous leurs données pour une meilleure prise de décision en moins de temps. Différents Big Data produits et techniques fournissent une plate-forme logicielle end-to-end pour la collecte, la préparation, l'analyse et la présentation d'informations sur les grandes données. Les domaines d'application comprennent la surveillance des performances du réseau, la détection de fraudes, la détection du client et l'analyse du risque de crédit. Big Data & Scale des produits d'analyse pour gérer des terabytes de données mais la mise en œuvre de ces outils nécessite un nouveau type de système de base de données basé sur le cloud comme Hadoop ou un processeur de calcul parallèle à grande échelle (KPU, etc.)
Ce cours travaille sur Big Data BI pour Telco couvre toutes les nouvelles zones émergentes dans lesquelles les CSP investissent pour augmenter la productivité et ouvrir de nouveaux flux de revenus d'affaires. Le cours fournira une vue complète de 360 degrés sur Big Data BI à Telco afin que les décideurs et les gestionnaires puissent avoir un aperçu très large et complet des possibilités de Big Data BI à Telco pour la productivité et l'amélioration des revenus.
Objectifs du cours
L'objectif principal du cours est d'introduire de nouvelles Big Data techniques d'intelligence d'affaires dans 4 secteurs de Telecom Business (Marketing/Ventes, Opération réseau, Opération financière et Relation client Management). Les étudiants seront introduits à suivre :
- Introduction à Big Data-ce qui est 4Vs (volume, vitesse, variété et veracité) dans Big Data- Génération, extraction et gestion de la perspective Telco
- Comment Big Data l'analytique diffère de l'analytique des données d'héritage
- La justification intérieure de la Big Data -Telco perspective
- Introduction à Hadoop Écosystème- familiarité avec tous les Hadoop outils tels que Hive, Pig, SPARC – quand et comment ils sont utilisés pour résoudre Big Data problème
- Comment Big Data est extrait pour l'analyse pour les outils d'analyse-comment Business Analysis’s peuvent réduire leurs points de douleur de collecte et d'analyse des données grâce à une approche intégrée Hadoop de tableau de bord
- Introduction fondamentale de l'analyse Insight, de l'analyse de la visualisation et de l'analyse prédictive pour Telco
- L'analyse client Churn et Big Data-comment Big Data peut réduire l'analyse client Churn et l'insatisfaction des clients dans les études de cas Telco
- Analyse d'échecs réseau et d'échecs de service à partir des méta-data réseau et IPDR
- Analyse financière-fraude, fraude et estimation du ROI à partir des ventes et des données opérationnelles
- Problème d'acquisition client-Marketing cible, segmentation client et cross-sales à partir des données de vente
- Introduction et résumé de tous Big Data produits d'analyse et où ils s'adaptent à l'espace d'analyse Telco
- Conclusion-comment prendre une approche étape par étape pour introduire Big Data Business Intelligence dans votre organisation
Audience cible
- Opération réseau, gestionnaires financiers, gestionnaires CRM et gestionnaires informatiques de premier plan dans le bureau du CIO de Telco.
- Business Analystes à Telco
- Gestionnaire de bureau / analystes
- gestionnaires opérationnels
- Général QA
Introduction to Google Colab for Data Science
14 HeuresCette formation en direct avec instructeur en Canada (en ligne ou sur site) s'adresse aux data scientists débutants et aux professionnels de l'informatique qui souhaitent apprendre les bases de la science des données en utilisant Google Colab.
À la fin de cette formation, les participants seront en mesure de :
- Configurer et naviguer dans Google Colab.
- Écrire et exécuter du code Python de base.
- Importer et manipuler des ensembles de données.
- Créer des visualisations à l'aide de bibliothèques Python.
A Practical Introduction to Data Science
35 HeuresLes participants qui suivent cette formation acquièrent une compréhension pratique et concrète du Data Science et des technologies, méthodologies et outils qui y sont associés.
Les participants auront l'occasion de mettre en pratique ces connaissances par le biais d'exercices pratiques. L'interaction en groupe et le retour d'information de l'instructeur constituent une composante importante du cours.
Le cours commence par une introduction aux concepts élémentaires de Data Science, puis progresse vers les outils et méthodologies utilisés dans Data Science.
Public
- Développeurs
- Analystes techniques
- Consultants en informatique
Format du cours
- En partie conférence, en partie discussion, exercices et pratique intensive.
Remarque
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.
Data Science for Big Data Analytics
35 HeuresLes données volumineuses sont des ensembles de données si volumineux et complexes qu'un logiciel de traitement de données traditionnel ne permet pas de les traiter. Les défis du Big Data incluent la capture, le stockage, l'analyse, la recherche, le partage, le transfert, la visualisation, l'interrogation, la mise à jour et la confidentialité des informations.
Data Science essential for Marketing/Sales professionals
21 HeuresCe cours est destiné aux Marketing professionnels de la vente qui souhaitent approfondir l'application de la science des données dans Marketing/Ventes. Le cours fournit une couverture détaillée des différentes techniques de science des données utilisées pour la « vente incitative », la « vente croisée », la segmentation du marché, le branding et le CLV.
Différence de Marketing et ventes – En quoi les ventes et le marketing sont-ils différents ?
En termes très simples, les ventes peuvent être décrites comme un processus qui se concentre ou cible des individus ou de petits groupes. Marketing s'adresse en revanche à un groupe plus large ou au grand public. Marketing comprend la recherche (identification des besoins du client), le développement de produits (production de produits innovants) et la promotion du produit (par le biais de publicités) et la sensibilisation au produit auprès des consommateurs. En tant que tel, le marketing signifie générer des prospects ou des prospects. Une fois le produit mis sur le marché, il incombe au vendeur de persuader le client d’acheter le produit. Les ventes consistent à convertir les leads ou les prospects en achats et en commandes, tandis que le marketing vise des termes plus longs, tandis que les ventes concernent des objectifs plus courts.
Introduction to Data Science
35 HeuresCette formation dirigée par un instructeur en direct (sur site ou à distance) s'adresse aux professionnels qui souhaitent débuter une carrière en Data Science .
À la fin de cette formation, les participants seront en mesure de:
- Installez et configurez Python et MySql.
- Comprenez ce qu'est Data Science et comment elle peut ajouter de la valeur à pratiquement n'importe quelle entreprise.
- Apprenez les bases du codage en Python
- Apprenez les techniques de Machine Learning supervisées et non supervisées, et comment les mettre en œuvre et interpréter les résultats.
Format du cours
- Conférence et discussion interactives.
- Beaucoup d'exercices et de pratique.
- Implémentation pratique dans un environnement de laboratoire en direct.
Options de personnalisation des cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Kaggle
14 HeuresCette formation en Canada (en ligne ou sur site) est destinée aux data scientists et aux développeurs qui souhaitent apprendre et développer leur carrière dans Data Science en utilisant Kaggle.
A l'issue de cette formation, les participants seront capables de :
- S'informer sur la science des données et l'apprentissage automatique.
- Explorer l'analyse des données.
- En savoir plus sur Kaggle et son fonctionnement.
Data Science with KNIME Analytics Platform
21 HeuresKNIME La plate-forme d’analyse est une option de source ouverte de premier plan pour l’innovation basée sur les données, vous aidant à découvrir le potentiel caché dans vos données, à miner pour de nouvelles informations ou à prédire de nouvelles futures. Avec plus de 1000 modules, des centaines d’exemples prêts à se lancer, un large éventail d’outils intégrés et la plus large sélection d’algorithmes avancés disponibles, KNIME Analytics Platform est la boîte d’outils idéale pour tout scientifique de données et analyste d’affaires.
Ce cours pour KNIME Platform Analytics est une opportunité idéale pour les débutants, les utilisateurs avancés et KNIME experts à être introduits à KNIME, pour apprendre à l'utiliser plus efficacement, et comment créer des rapports clairs et complets basés sur KNIME flux de travail
Cette formation guidée par des instructeurs, en direct (online ou sur site) est destinée à des professionnels de données qui souhaitent utiliser KNIME pour répondre aux besoins complexes des entreprises.
Il est ciblé pour le public qui ne connaît pas la programmation et vise à utiliser des outils de pointe pour mettre en œuvre des scénarios d'analyse.
À la fin de cette formation, les participants seront en mesure de :
- Installer et configurer KNIME.
- Créer des scénarios Data Science
- Trains, tests et modèles validés
- La mise en œuvre met fin à la chaîne de valeur finale des modèles de la science des données
Le format du cours
- Lecture et discussion interactives.
- Beaucoup d’exercices et de pratiques.
- La mise en œuvre dans un environnement de laboratoire en direct.
Options de personnalisation de cours
- Pour demander une formation personnalisée pour ce cours ou pour en savoir plus sur ce programme, veuillez nous contacter pour organiser.
MATLAB Fundamentals, Data Science & Report Generation
35 HeuresDans la première partie de cette formation, nous couvrons les fondamentaux de MATLAB et sa fonction à la fois comme langage et comme plateforme. Cette discussion comprend une introduction à la syntaxe de MATLAB, aux tableaux et aux matrices, à la visualisation de données, au développement de scripts et aux principes orientés objet.
Dans la deuxième partie, nous montrons comment utiliser MATLAB pour l'exploration de données, l'apprentissage automatique et l'analyse prédictive. Pour donner aux participants une perspective claire et pratique de l'approche et de la puissance de MATLAB, nous établissons des comparaisons entre l'utilisation de MATLAB et l'utilisation d'autres outils tels que les tableurs, le C, C++ et Visual Basic.
Dans la troisième partie de la formation, les participants apprennent à rationaliser leur travail en automatisant le traitement des données et la génération de rapports.
Tout au long de la formation, les participants mettront en pratique les idées apprises au moyen d'exercices pratiques dans un environnement de laboratoire. À la fin de la formation, les participants auront une connaissance approfondie des capacités de MATLAB et seront en mesure de l'utiliser pour résoudre des problèmes réels de science des données ainsi que pour rationaliser leur travail grâce à l'automatisation.
Des évaluations seront effectuées tout au long du cours pour mesurer les progrès réalisés.
Format du cours
- Le cours comprend des exercices théoriques et pratiques, y compris des discussions de cas, l'inspection d'exemples de code, et la mise en œuvre pratique.
Remarque
- Les sessions pratiques seront basées sur des modèles de rapports de données préétablis. Si vous avez des besoins spécifiques, veuillez nous contacter pour convenir d'un arrangement.
Accelerating Python Pandas Workflows with Modin
14 HeuresCette formation en direct avec instructeur dans Canada (en ligne ou sur site) est destinée aux scientifiques des données et aux développeurs qui souhaitent utiliser Modin pour construire et mettre en œuvre des calculs parallèles avec Pandas afin d'accélérer l'analyse des données.
A la fin de cette formation, les participants seront capables de :
- Mettre en place l'environnement nécessaire pour commencer à développer des flux de travail Pandas à l'échelle avec Modin.
- Comprendre les caractéristiques, l'architecture et les avantages de Modin.
- Connaître les différences entre Modin, Dask et Ray.
- Effectuer des opérations Pandas plus rapidement avec Modin.
- Mettre en œuvre l'ensemble de l'API et des fonctions Pandas.
GPU Data Science with NVIDIA RAPIDS
14 HeuresCette formation en Canada (en ligne ou sur site) s'adresse aux data scientists et aux développeurs qui souhaitent utiliser RAPIDS pour construire des pipelines de données, des workflows et des visualisations accélérés par GPU, en appliquant des algorithmes d'apprentissage automatique, tels que XGBoost, cuML, etc.
A la fin de cette formation, les participants seront capables de :
- Mettre en place l'environnement de développement nécessaire pour construire des modèles de données avec NVIDIA RAPIDS.
- Comprendre les caractéristiques, les composants et les avantages de RAPIDS.
- Exploiter les GPU pour accélérer les pipelines de données et d'analyse de bout en bout.
- Mettre en œuvre la préparation des données et l'ETL accélérés par GPU avec cuDF et Apache Arrow.
- Apprendre à réaliser des tâches d'apprentissage automatique avec les algorithmes XGBoost et cuML.
- Construire des visualisations de données et exécuter des analyses graphiques avec cuXfilter et cuGraph.