Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à Large Language Models (LLMs)
- Vue d'ensemble des LLM
- Définition et importance
- Applications dans l'IA aujourd'hui
Architecture des transformateurs
- Qu'est-ce qu'un transformateur et comment fonctionne-t-il ?
- Principaux composants et caractéristiques
- Encastrement et codage positionnel
- Attention multi-têtes
- Réseau neuronal ascendant
- Normalisation et connexions résiduelles
Modèles de transformation
- Mécanisme d'auto-attention
- Architecture codeur-décodeur
- Enchâssements positionnels
- BERT (Bidirectional Encoder Representations from Transformers)
- GPT (Transformateur génératif pré-entraîné)
Optimisation des performances et pièges
- Longueur du contexte
- Mamba et modèles d'espace d'état
- Attention flash
- Transformateurs épars
- Transformateurs de vision
- Importance de la quantification
Amélioration des transformateurs
- Génération de textes augmentés pour la recherche d'information
- Mélange de modèles
- Arbre de pensées
Ajustement fin
- Théorie de l'adaptation à faible rang
- Ajustement fin avec QLora
Lois d'échelle et optimisation dans les LLMs
- Importance des lois d'échelle pour les LLM
- Mise à l'échelle de la taille des données et du modèle
- Mise à l'échelle informatique
- Mise à l'échelle de l'efficacité des paramètres
Optimisation
- Relation entre la taille du modèle, la taille des données, le budget de calcul et les exigences d'inférence
- Optimisation des performances et de l'efficacité des LLM
- Meilleures pratiques et outils pour la formation et la mise au point des LLM
Formation et mise au point des LLM
- Étapes et défis de la formation des LLM à partir de zéro
- Acquisition et maintenance des données
- Données à grande échelle, exigences en matière d'unité centrale et de mémoire
- Défis d'optimisation
- Paysage des LLM à source ouverte
Principes fondamentaux de Reinforcement Learning (RL)
- Introduction à Reinforcement Learning
- Apprentissage par renforcement positif
- Définition et concepts de base
- Processus de décision de Markov (MDP)
- Programmation dynamique
- Méthodes de Monte Carlo
- Apprentissage par différence temporelle
Profond Reinforcement Learning
- Réseaux Q profonds (DQN)
- Optimisation de la politique proximale (PPO)
- Elements de Reinforcement Learning
Intégration des LLM et Reinforcement Learning
- Combinaison de LLM et de Reinforcement Learning
- Comment le RL est utilisé dans les LLM
- Reinforcement Learning avec retour d'information humain (RLHF)
- Alternatives au RLHF
Études de cas et applications
- Applications dans le monde réel
- Réussites et défis
Sujets avancés
- Techniques avancées
- Méthodes d'optimisation avancées
- Recherche et développement de pointe
Résumé et prochaines étapes
Pré requis
- Compréhension de base de Machine Learning
Public
- Scientifiques des données
- Ingénieurs en logiciel
21 Heures