Question 1

Quelles sont les étapes d'un pipeline de chatbot ?

Accepted Answer

Un pipeline de chatbot typique comprend : 1) Prétraitement (normalisation, correction orthographique), 2) NLU (détection d'intention, extraction d'entités), 3) Dialogue management (décision de l'action), 4) Récupération de contexte (RAG, appels API), 5) Génération de réponse (LLM), 6) Post-traitement (filtrage de contenu, personnalisation), 7) Logging et analytics. Chaque étape est un module testable indépendamment.

Question 2

Comment monitorer un pipeline IA en production ?

Accepted Answer

Le monitoring d'un pipeline IA couvre : les métriques de performance (latence par étape, débit), les taux d'erreur et exceptions, la qualité des prédictions (drift detection), les coûts (tokens consommés, appels API), et les métriques métier (taux de résolution, satisfaction). Des outils comme MLflow, Weights & Biases, ou LangSmith permettent la traçabilité bout-en-bout.

Question 3

Comment gérer les erreurs dans un pipeline IA ?

Accepted Answer

La gestion d'erreurs dans un pipeline inclut : des fallbacks par étape (si le LLM échoue, utiliser un template), des retries avec backoff exponentiel pour les erreurs transitoires, des circuit breakers pour éviter les cascades, et une escalade gracieuse (passer à un humain si le pipeline échoue). Chaque étape doit renvoyer un résultat exploitable même en mode dégradé.

Question 4

Pourquoi le pre-training est-il si coûteux ?

Accepted Answer

Le pre-training nécessite : des téraoctets de données textuelles nettoyées, des milliers de GPU pendant des semaines à mois, et une ingénierie complexe (parallélisation, stabilité). les plus grands LLM coûtent des dizaines à centaines de millions de dollars en calcul. C'est pourquoi seules quelques entreprises (OpenAI, Google, Meta, Anthropic) pré-entraînent des LLM de pointe. Les autres utilisent ces modèles via API ou fine-tuning.

Question 5

Quelle différence entre pre-training et fine-tuning ?

Accepted Answer

Le pre-training apprend des capacités générales sur des données massives et diverses. Le fine-tuning adapte ce modèle pré-entraîné à une tâche ou domaine spécifique avec des données ciblées (plus petites). Analogie : le pre-training donne une éducation générale, le fine-tuning enseigne un métier. Le fine-tuning est 100 à 1000 fois moins coûteux que le pre-training.

Question 6

Peut-on faire du pre-training en entreprise ?

Accepted Answer

Le pre-training from scratch est hors de portée de la plupart des entreprises (coût, expertise, données). Cependant, le "continued pre-training" (reprendre l'entraînement d'un modèle existant sur des données sectorielles) est envisageable pour les grandes organisations avec des données propriétaires massives. Pour la majorité, le fine-tuning ou le prompting suffisent pour adapter les LLM existants.

Question 7

Qu'est-ce qui fait un bon prompt ?

Accepted Answer

Un bon prompt est : clair et spécifique (pas d'ambiguïté), contextualisé (qui parle, à qui, dans quel cadre), structuré (étapes ou format attendu), et avec des exemples si nécessaire (few-shot). Il définit le rôle du modèle, les contraintes, et le format de sortie souhaité. Les mauvais prompts sont vagues ("Aide-moi"), sans contexte, ou contradictoires.

Question 8

Quelles sont les parties d'un prompt de chatbot ?

Accepted Answer

Un prompt de chatbot comprend typiquement : le prompt système (rôle, ton, règles, limites), le contexte (informations récupérées par RAG), l'historique de conversation (messages précédents), et le message utilisateur actuel. Le prompt système définit la personnalité et les garde-fous. Les instructions peuvent inclure des consignes de conformité (ne jamais donner de conseil médical).

Question 9

Comment tester et itérer sur les prompts ?

Accepted Answer

Le test de prompts passe par : un jeu d'évaluation (questions + réponses attendues), des tests sur des cas limites (edge cases), la comparaison de variantes de prompts, et des métriques de qualité (pertinence, exactitude, ton). Des outils comme PromptFoo, Promptimize, ou les playgrounds des fournisseurs facilitent l'itération. Les prompts évoluent continuellement en production selon les retours.

Question 10

Quelles sont les techniques de prompt engineering essentielles ?

Accepted Answer

Les techniques clés sont : Chain-of-Thought (demander de raisonner étape par étape), Few-shot (donner des exemples), Role prompting (définir un personnage/expert), Instruction explicite (format de sortie précis), Self-consistency (générer plusieurs réponses et voter), et ReAct (raisonnement + action). Le choix dépend de la tâche : Chain-of-Thought pour le raisonnement, Few-shot pour les formats spécifiques.

Question 11

Le prompt engineering remplace-t-il le fine-tuning ?

Accepted Answer

Le prompt engineering et le fine-tuning sont complémentaires. Le prompting est plus flexible et moins coûteux, idéal pour expérimenter et adapter rapidement. Le fine-tuning encode les comportements dans le modèle, réduisant la longueur des prompts et améliorant la cohérence. Pour un chatbot entreprise, nous combinons souvent : fine-tuning pour le ton, prompting pour les instructions dynamiques.

Question 12

Comment le prompt engineering évolue-t-il ?

Accepted Answer

Le prompt engineering devient plus systématique : des frameworks comme DSPY automatisent l'optimisation des prompts, des outils de gestion de prompts (version control, A/B testing) émergent, et les modèles deviennent meilleurs pour suivre des instructions simples. La tendance est vers moins d'ingénierie manuelle et plus d'optimisation automatique, mais la compréhension des principes reste essentielle.

Question 13

Quelles étapes de preprocessing pour un chatbot ?

Accepted Answer

Le preprocessing d'un chatbot peut inclure : normalisation du texte (minuscules, suppression de caractères spéciaux), correction orthographique, expansion des abréviations ("rdv" → "rendez-vous"), détection et masquage des données personnelles (pour le logging), et segmentation des phrases. Les LLM modernes nécessitent moins de preprocessing car ils gèrent les variations linguistiques, mais la normalisation reste utile.

Question 14

Le preprocessing est-il encore nécessaire avec les LLM ?

Accepted Answer

Les LLM réduisent le besoin de preprocessing linguistique classique (ils gèrent majuscules, fautes, variations). Cependant, un preprocessing reste utile pour : masquer les données sensibles, limiter la longueur des entrées, nettoyer le HTML/markdown, et normaliser les formats spécifiques (dates, numéros). Le preprocessing passe du traitement linguistique au traitement métier.

Question 15

Comment préserver les informations importantes lors du preprocessing ?

Accepted Answer

Le risque du preprocessing est de perdre des informations utiles. Bonnes pratiques : conserver les entités nommées même si on normalise le reste, préserver les nombres et dates intacts, garder la structure (paragraphes, listes), et documenter les transformations appliquées. Pour les cas critiques, fournir la version brute et prétraitée au modèle peut aider.

Glossaire de l'Intelligence Artificielle

Pipeline IA

Définition complète

Questions fréquentes

Articles associés

Pre-training (Pré-entraînement)

Définition complète

Questions fréquentes

Articles associés

Prompt

Définition complète

Questions fréquentes

Articles associés

Prompt Engineering

Définition complète

Questions fréquentes

Articles associés

Preprocessing (Prétraitement)

Définition complète

Questions fréquentes

Articles associés

Un terme vous manque ?

Reservez votre diagnostic IA

Réservez votre diagnostic IA

Glossaire de l'Intelligence Artificielle

Pipeline IA

Définition complète

Questions fréquentes

Articles associés

Pre-training (Pré-entraînement)

Définition complète

Questions fréquentes

Articles associés

Prompt

Définition complète

Questions fréquentes

Articles associés

Prompt Engineering

Définition complète

Questions fréquentes

Articles associés

Preprocessing (Prétraitement)

Définition complète

Questions fréquentes

Articles associés

Un terme vous manque ?

Reservez votre diagnostic IA

Réservez votre diagnostic IA