Question 1

Comment le NER est-il utilisé dans un chatbot ?

Accepted Answer

Dans un chatbot, le NER extrait les informations essentielles : "Je veux annuler ma réservation du 15 mars au nom de Dupont" → DATE: 15 mars, PERSON: Dupont. Ces entités alimentent ensuite les appels aux systèmes backend (rechercher la réservation par nom et date). Sans NER, le chatbot ne saurait pas quelles informations manipuler.

Question 2

Quels sont les types d'entités les plus courants ?

Accepted Answer

Les entités standards sont : PERSON (noms de personnes), ORG (organisations), LOC/GPE (lieux), DATE (dates), TIME (heures), MONEY (montants), PERCENT (pourcentages), EMAIL, PHONE. En entreprise, nous ajoutons des entités métier : numéro de contrat, référence produit, code postal. Les modèles NER peuvent être entraînés pour détecter des entités personnalisées.

Question 3

Quelle est la précision du NER en français ?

Accepted Answer

Les modèles NER modernes atteignent 90-95% de F1-score sur le français pour les entités classiques (personnes, lieux, organisations). Les performances diminuent sur les entités métier spécifiques sans fine-tuning. Les LLM modernes extraient les entités de façon zero-shot avec une bonne précision, mais les modèles NER spécialisés restent plus rapides et économiques à l'échelle.

Question 4

Comment fonctionne un réseau de neurones ?

Accepted Answer

Un réseau de neurones traite l'information en 3 étapes : l'entrée (données brutes : pixels, mots), les couches cachées (transformations successives : multiplication par des poids + fonction d'activation), et la sortie (prédiction : classe, texte, valeur). L'entraînement utilise la rétropropagation : comparer la sortie à la cible, calculer l'erreur, ajuster les poids pour la réduire. Répété des millions de fois.

Question 5

Quels types de réseaux de neurones existent ?

Accepted Answer

Les principaux types sont : CNN (Convolutional) pour les images, RNN/LSTM (Recurrent) pour les séquences temporelles, Transformer pour le texte (LLM), GAN pour la génération d'images, et MLP (Multi-Layer Perceptron) pour les données tabulaires. Le Transformer domine aujourd'hui le NLP et gagne du terrain en vision. Le choix dépend du type de données et de la tâche.

Question 6

Les réseaux de neurones sont-ils des "boîtes noires" ?

Accepted Answer

Oui, les réseaux de neurones profonds sont difficilement interprétables : ils contiennent des millions de paramètres sans signification intuitive. Nous ne pouvons pas facilement expliquer "pourquoi cette décision". Des techniques d'explicabilité (SHAP, attention visualization) aident mais restent imparfaites. Pour les applications critiques, cette opacité est un enjeu de conformité et de confiance.

Question 7

Quelles sont les principales tâches du NLP ?

Accepted Answer

Les tâches NLP majeures sont : classification de texte (spam, sentiment, intention), extraction d'entités (NER), analyse syntaxique (parsing), résumé automatique, traduction, réponse aux questions, génération de texte, et dialogue. Les chatbots combinent plusieurs de ces tâches : détection d'intention (classification), extraction d'entités (NER), et génération de réponse (NLG).

Question 8

Comment le NLP a-t-il évolué avec les LLM ?

Accepted Answer

Avant les LLM, le NLP nécessitait des pipelines séparés pour chaque tâche, avec beaucoup d'ingénierie manuelle. Les LLM unifient toutes les tâches dans un seul modèle capable de tout faire via des instructions en langage naturel. Un même LLM peut classifier, extraire, traduire, et générer. C'est un changement de paradigme : de la conception de pipelines à la conception de prompts.

Question 9

Le NLP fonctionne-t-il aussi bien en français qu'en anglais ?

Accepted Answer

Historiquement, le NLP était moins performant en français (moins de données d'entraînement). Les LLM modernes réduisent cet écart car ils sont entraînés sur des corpus multilingues. les LLM des principaux fournisseurs (OpenAI, Anthropic, Mistral) gèrent très bien le français. Pour des tâches spécifiques, des modèles français (CamemBERT, Mistral) peuvent être meilleurs. Les accents, les tournures idiomatiques, et le vocabulaire métier restent des défis.

Question 10

Quelle est la différence entre NLP, NLU et NLG ?

Accepted Answer

Le NLP est le domaine global du traitement du langage naturel. Le NLU (Understanding) est la compréhension : détecter l'intention, extraire le sens. Le NLG (Generation) est la production : générer du texte naturel. Un chatbot utilise NLU pour comprendre la question, puis NLG pour formuler la réponse. Les LLM combinent les deux capacités dans un seul modèle.

Question 11

Quelles sont les composantes du NLU dans un chatbot ?

Accepted Answer

Le NLU d'un chatbot comprend : la détection d'intention (quel est le but : réservation, réclamation, info ?), l'extraction d'entités (quelles données : date, nom, montant ?), la résolution de coréférence (à quoi renvoie "il", "ça" ?), et l'analyse de sentiment (ton positif, négatif, neutre). Ces éléments sont passés au dialogue manager qui décide de l'action.

Question 12

Comment évaluer la qualité du NLU d'un chatbot ?

Accepted Answer

La qualité du NLU se mesure par : l'accuracy sur la détection d'intention (% d'intentions correctement identifiées), le F1-score sur l'extraction d'entités (précision × rappel), le taux de fallback (intentions non reconnues), et les tests sur des formulations variées d'une même demande. Un bon NLU reconnaît "je veux annuler", "annulation svp", et "comment annuler ?" comme la même intention.

Question 13

Comment fonctionne la génération de texte par les LLM ?

Accepted Answer

Les LLM génèrent du texte token par token. À chaque étape, le modèle calcule la probabilité de chaque mot possible étant donné le contexte (prompt + mots déjà générés), et en sélectionne un. Le paramètre "température" contrôle la créativité : basse = déterministe, haute = plus aléatoire. Ce processus auto-régressif produit des textes fluides car le modèle a appris les patterns linguistiques sur des milliards de textes.

Question 14

Comment contrôler le style et le ton du texte généré ?

Accepted Answer

Le contrôle du style passe par : des instructions explicites dans le prompt ("Réponds de façon formelle et concise"), des exemples du style attendu (few-shot), le fine-tuning sur des exemples de la marque, et les paramètres d'inférence (température, top_p). Pour les chatbots d'entreprise, nous définissons généralement un "ton de voix" dans le prompt système, testé sur des échantillons variés.

Question 15

Quels sont les risques du NLG automatique ?

Accepted Answer

Les risques du NLG incluent : les hallucinations (génération de fausses informations), le manque de cohérence sur de longs textes, les biais hérités des données d'entraînement, et la difficulté à garantir la conformité (le modèle peut dire des choses non autorisées). Pour les applications critiques, nous combinons NLG avec des garde-fous : validation de règles, templates contraints, et revue humaine.

Glossaire de l'Intelligence Artificielle

NER (Named Entity Recognition)

Définition complète

Questions fréquentes

Articles associés

Neural Network (Réseau de Neurones)

Définition complète

Questions fréquentes

Articles associés

NLP (Natural Language Processing)

Définition complète

Questions fréquentes

Articles associés

NLU (Natural Language Understanding)

Définition complète

Questions fréquentes

Articles associés

NLG (Natural Language Generation)

Définition complète

Questions fréquentes

Articles associés

Un terme vous manque ?

Reservez votre diagnostic IA

Réservez votre diagnostic IA

Glossaire de l'Intelligence Artificielle

NER (Named Entity Recognition)

Définition complète

Questions fréquentes

Articles associés

Neural Network (Réseau de Neurones)

Définition complète

Questions fréquentes

Articles associés

NLP (Natural Language Processing)

Définition complète

Questions fréquentes

Articles associés

NLU (Natural Language Understanding)

Définition complète

Questions fréquentes

Articles associés

NLG (Natural Language Generation)

Définition complète

Questions fréquentes

Articles associés

Un terme vous manque ?

Reservez votre diagnostic IA

Réservez votre diagnostic IA