Plan du cours
Statistics & Probabiliste Programming dans Julia
Statistiques de base
- Statistics
- Résumé Statistics avec le paquet statistique
- Distributions et package StatsBase
- Univarié & multivarié
- Moments
- Fonctions de probabilité
- Échantillonnage et RNG
- Histogrammes
- Estimation du maximum de vraisemblance
- Produit, trucage et distribution censurée
- Statistiques robustes
- Corrélation et covariance
DataFrames
(Paquet DataFrames)
- E/S de données
- Création de cadres de données
- Types de données, y compris les données catégorielles et manquantes
- Tri et jointure
- Remodelage et pivotement des données
Tests d'hypothèses
(paquet HypothesisTests)
- Principes des tests d'hypothèses
- Test du chi carré
- Test z et test t
- Test F
- Test exact de Fisher
- ANOVA
- Tests de normalité
- Test de Kolmogorov-Smirnov
- Test T de Hotelling
Analyse de régression et de survie
(progiciels GLM et Survival)
- Principes de la régression linéaire et de la famille exponentielle
- Régression linéaire
- Modèles linéaires généralisés
- Régression logistique
- Régression de Poisson
- Régression gamma
- Autres modèles GLM
- Analyse de survie
- Événements
- Kaplan-Meier
- Nelson-Aalen
- Risque proportionnel de Cox
Distances
(Paquet Distances)
- Qu'est-ce qu'une distance ?
- Euclidienne
- Cityblock
- Cosinus
- Corrélation
- Mahalanobis
- Hamming
- MAD
- RMS
- Écart quadratique moyen
Statistiques multivariées
(paquets MultivariateStats, Lasso et Loess)
- Régression de crête
- Régression Lasso
- Loess
- Analyse discriminante linéaire
- Analyse en composantes principales (ACP)
- ACP linéaire
- ACP à noyau
- ACP probabiliste
- ACP indépendante
- Régression en composantes principales (PCR)
- Analyse factorielle
- Analyse de corrélation canonique
- Mise à l'échelle multidimensionnelle
Regroupement
(package Clustering)
- K-moyens
- K-médoïdes
- DBSCAN
- Regroupement hiérarchique
- Algorithme de cluster de Markov
- Clustering C-means flou
Bayésien Statistics et probabiliste Programming
(paquet de Turing)
- Modèle de chaîne de Markov Carlo
- Hamiltonien Montel Carlo
- Modèles de mélange gaussien
- Régression linéaire bayésienne
- Régression bayésienne de la famille exponentielle
- Bayesien Neural Networks
- Modèles de Markov cachés
- Filtrage particulaire
- Inférence variationnelle
Pré requis
Ce cours s'adresse aux personnes qui ont déjà des connaissances en science des données et en statistiques.
Nos clients témoignent (5)
La variation en fonction de l'exercice et de l'exposition.
Ida Sjoberg - Swedish National Debt Office
Formation - Econometrics: Eviews and Risk Simulator
Traduction automatique
le formateur avait de la patience et était impatient de s'assurer que nous avons tous compris les sujets, les cours étaient amusants à suivre
Mamonyane Taoana - Road Safety Department
Formation - Statistical Analysis using SPSS
Traduction automatique
Le rythme était parfait et l'atmosphère détendue a permis aux candidats de se sentir à l'aise pour poser des questions.
Rhian Hughes - Public Health Wales NHS Trust
Formation - Introduction to Data Visualization with Tidyverse and R
Traduction automatique
Michael the trainer is very knowledgeable and skillful about the subject of Big Data and R. He is very flexible and quickly customize the training meeting clients' need. He is also very capable to solve technical and subject matter problems on the go. Fantastic and professional training!.
Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Formation - Programming with Big Data in R
Traduction automatique
I enjoyed the Excel sheets provided having the exercises with examples. This meant that if Tamil was held up helping other people, I could crack on with the next parts.
Luke Pontin
Formation - Data and Analytics - from the ground up
Traduction automatique