Plan du cours

Introduction à Large Language Models (LLMs)

  • Vue d'ensemble des LLM
  • Définition et importance
  • Applications dans l'IA aujourd'hui

Architecture des transformateurs

  • Qu'est-ce qu'un transformateur et comment fonctionne-t-il ?
  • Principaux composants et caractéristiques
  • Encastrement et codage positionnel
  • Attention multi-têtes
  • Réseau neuronal ascendant
  • Normalisation et connexions résiduelles

Modèles de transformation

  • Mécanisme d'auto-attention
  • Architecture codeur-décodeur
  • Enchâssements positionnels
  • BERT (Bidirectional Encoder Representations from Transformers)
  • GPT (Transformateur génératif pré-entraîné)

Optimisation des performances et pièges

  • Longueur du contexte
  • Mamba et modèles d'espace d'état
  • Attention flash
  • Transformateurs épars
  • Transformateurs de vision
  • Importance de la quantification

Amélioration des transformateurs

  • Génération de textes augmentés pour la recherche d'information
  • Mélange de modèles
  • Arbre de pensées

Ajustement fin

  • Théorie de l'adaptation à faible rang
  • Ajustement fin avec QLora

Lois d'échelle et optimisation dans les LLMs

  • Importance des lois d'échelle pour les LLM
  • Mise à l'échelle de la taille des données et du modèle
  • Mise à l'échelle informatique
  • Mise à l'échelle de l'efficacité des paramètres

Optimisation

  • Relation entre la taille du modèle, la taille des données, le budget de calcul et les exigences d'inférence
  • Optimisation des performances et de l'efficacité des LLM
  • Meilleures pratiques et outils pour la formation et la mise au point des LLM

Formation et mise au point des LLM

  • Étapes et défis de la formation des LLM à partir de zéro
  • Acquisition et maintenance des données
  • Données à grande échelle, exigences en matière d'unité centrale et de mémoire
  • Défis d'optimisation
  • Paysage des LLM à source ouverte

Principes fondamentaux de Reinforcement Learning (RL)

  • Introduction à Reinforcement Learning
  • Apprentissage par renforcement positif
  • Définition et concepts de base
  • Processus de décision de Markov (MDP)
  • Programmation dynamique
  • Méthodes de Monte Carlo
  • Apprentissage par différence temporelle

Profond Reinforcement Learning

  • Réseaux Q profonds (DQN)
  • Optimisation de la politique proximale (PPO)
  • Elements de Reinforcement Learning

Intégration des LLM et Reinforcement Learning

  • Combinaison de LLM et de Reinforcement Learning
  • Comment le RL est utilisé dans les LLM
  • Reinforcement Learning avec retour d'information humain (RLHF)
  • Alternatives au RLHF

Études de cas et applications

  • Applications dans le monde réel
  • Réussites et défis

Sujets avancés

  • Techniques avancées
  • Méthodes d'optimisation avancées
  • Recherche et développement de pointe

Résumé et prochaines étapes

Pré requis

  • Compréhension de base de Machine Learning

Public

  • Scientifiques des données
  • Ingénieurs en logiciel
 21 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires