Dictionnaire de jargon IA

Démystifiez la terminologie de l'intelligence artificielle avec notre glossaire complet. De l'apprentissage automatique aux réseaux neuronaux, nous décortiquons les concepts complexes de l'IA en termes simples.

Alignement (Alignment)

Alignment
Le processus consistant à garantir que les objectifs, les sorties et les comportements d'un système d'IA sont conformes aux buts et aux valeurs humaines. Ceci est particulièrement important pour les systèmes avancés qui pourraient développer des comportements non explicitement prévus.
Exemple : S'assurer qu'un chatbot de santé mentale ne recommande jamais d'actions nuisibles, quelles que soient les invites.

Interface de programmation d'applications (API) (Application Programming Interface (API))

Application Programming Interface (API)
Un ensemble de règles et de protocoles définis qui permettent à différents systèmes logiciels de communiquer et d'échanger des données.
Exemple : Utiliser l'API OpenAI pour envoyer une invite et recevoir une réponse générée par un modèle linguistique dans votre application web.

Intelligence Artificielle Générale (IAG) (Artificial General Intelligence (AGI))

Artificial General Intelligence (AGI)
Une forme théorique d'IA capable d'accomplir toute tâche intellectuelle qu'un être humain peut accomplir. Elle généralise l'apprentissage à travers les domaines.
Exemple : Un système d'IAG pourrait apprendre la composition musicale, effectuer une chirurgie et réussir un examen de philosophie sans programmation spécifique à la tâche.

Intelligence Artificielle (IA) (Artificial Intelligence (AI))

Artificial Intelligence (AI)
La simulation de l'intelligence humaine dans des machines programmées pour penser, raisonner et agir de manière autonome.
Exemple : L'IA alimente les assistants personnels comme Siri et les systèmes de conduite autonome comme Tesla Autopilot.

Éthique de l'IA (AI Ethics)

AI Ethics
Une discipline axée sur les implications morales du développement et de l'utilisation de l'IA, y compris l'équité, la confidentialité, la responsabilité et la non-discrimination.
Exemple : Créer des directives pour empêcher les algorithmes d'embauche de discriminer en fonction du sexe ou de l'origine ethnique.

Intelligence Augmentée (Augmented Intelligence)

Augmented Intelligence
Un modèle collaboratif où l'IA complète et améliore l'intelligence humaine plutôt que de la remplacer.
Exemple : Des outils de radiologie alimentés par l'IA qui mettent en évidence les anomalies pour les médecins, qui prennent le diagnostic final.

Agent Autonome (Autonomous Agent)

Autonomous Agent
Un système d'IA capable de prendre ses propres décisions et d'agir pour atteindre ses objectifs sans intervention humaine.
Exemple : Un robot de livraison autonome naviguant dans les rues de la ville et évitant les obstacles de manière indépendante.

Rétropropagation (Backpropagation)

Backpropagation
Une technique d'entraînement des réseaux neuronaux en mettant à jour les poids en sens inverse des couches de sortie vers les couches d'entrée, minimisant les erreurs de prédiction.
Exemple : Utilisé pour entraîner des classificateurs d'images afin de réduire le taux d'erreur dans la reconnaissance des chiffres manuscrits.

Biais (Biais Algorithmique) (Bias (Algorithmic Bias))

Bias (Algorithmic Bias)
Une favorisation involontaire et systématique dans les résultats de l'IA due à des données d'entraînement déséquilibrées ou non représentatives.
Exemple : Un système de reconnaissance faciale qui identifie mal les personnes de couleur plus fréquemment en raison de leur sous-représentation dans les données d'entraînement.

Big Data (Big Data)

Big Data
Des ensembles de données extrêmement volumineux qui nécessitent des outils spéciaux pour être stockés, analysés et exploités, souvent utilisés pour entraîner des modèles d'IA.
Exemple : Utiliser des millions d'interactions utilisateur pour entraîner des moteurs de recommandation pour les plateformes de commerce électronique.

Modèle Boîte Noire (Black Box Model)

Black Box Model
Un type de modèle d'IA ou d'apprentissage automatique dont la logique interne n'est pas facilement interprétable par les humains, ce qui rend difficile la compréhension de la manière dont les décisions sont prises.
Exemple : Un réseau neuronal profond utilisé pour approuver des prêts mais n'offrant aucune explication claire sur la raison pour laquelle un candidat a été accepté et un autre rejeté.

Informatique Cognitive (Cognitive Computing)

Cognitive Computing
Des systèmes d'IA conçus pour simuler les processus de pensée humaine, tels que le raisonnement et l'apprentissage, en utilisant des techniques comme le NLP et la reconnaissance de formes.
Exemple : Un système d'informatique cognitive qui aide les professionnels du droit à analyser la jurisprudence et à prédire les résultats.

Vision par Ordinateur (Computer Vision)

Computer Vision
Un domaine de l'intelligence artificielle qui permet aux ordinateurs d'interpréter et de traiter des données visuelles telles que des images et des vidéos.
Exemple : Des systèmes de reconnaissance faciale qui identifient les personnes dans les enregistrements de sécurité à l'aide de la vision par ordinateur.

Corpus (Corpus)

Corpus
Une grande collection de textes écrits ou parlés utilisée pour entraîner des modèles linguistiques.
Exemple : Le dataset Common Crawl est un corpus web public utilisé pour entraîner de grands modèles linguistiques comme GPT.

Dérive des Données (Data Drift)

Data Drift
Le phénomène où les données d'entrée changent avec le temps, entraînant une dégradation des performances du modèle.
Exemple : Un modèle de maintenance prédictive pour équipements industriels devient moins précis à mesure que de nouvelles technologies de capteurs sont introduites.

Étiquetage des Données (Data Labelling)

Data Labelling
Le processus d'annotation des données avec des étiquettes pour les rendre adaptées à l'apprentissage supervisé.
Exemple : Étiqueter des milliers d'images de tumeurs comme bénignes ou malignes pour entraîner un modèle de détection du cancer.

Exploration de Données (Data Mining)

Data Mining
Le processus de découverte de modèles, de corrélations et d'anomalies significatifs dans de grands ensembles de données.
Exemple : Les détaillants utilisent l'exploration de données pour identifier que les personnes qui achètent des couches achètent souvent aussi de la bière.

Apprentissage Profond (Deep Learning)

Deep Learning
Un sous-domaine de l'apprentissage automatique qui utilise des réseaux neuronaux à plusieurs couches pour modéliser des motifs complexes dans les données.
Exemple : L'apprentissage profond est utilisé dans les modèles linguistiques comme GPT-4 et les modèles de génération d'images comme Stable Diffusion.

Modèles de Diffusion (Diffusion Models)

Diffusion Models
Une classe de modèles génératifs qui apprennent à produire des données en transformant progressivement le bruit aléatoire en sorties structurées.
Exemple : Stable Diffusion crée des images photoréalistes à partir d'invites textuelles en utilisant des techniques de diffusion.

Embedding (Embedding)

Embedding
Une représentation vectorielle numérique des données, souvent utilisée pour capturer la signification sémantique des mots, des images ou des phrases.
Exemple : En NLP, le mot 'banque' peut avoir des embeddings similaires à 'argent' mais différents de 'rive' selon le contexte.

Époque (Epoch)

Epoch
Une itération complète sur l'ensemble du jeu de données d'entraînement pendant le processus d'entraînement d'un modèle d'apprentissage automatique.
Exemple : Si un jeu de données contient 1 000 exemples et qu'un modèle les voit tous une fois pendant l'entraînement, cela constitue une époque.

IA Éthique (Ethical AI)

Ethical AI
Une philosophie de conception et de déploiement qui garantit que les technologies d'IA fonctionnent de manière transparente, équitable et en accord avec les valeurs sociétales.
Exemple : Un outil d'embauche IA qui inclut des vérifications de biais pour prévenir la discrimination à l'encontre des candidats minoritaires.

Système Expert (Expert System)

Expert System
Un système d'IA qui imite les capacités de prise de décision d'un expert humain dans un domaine spécifique en utilisant des règles et de la logique.
Exemple : Un système expert utilisé en agriculture pour recommander des traitements de culture basés sur des données de sol et l'historique des ravageurs.

IA Explicable (XAI) (Explainable AI (XAI))

Explainable AI (XAI)
Des systèmes d'IA conçus pour rendre leurs processus internes et leurs décisions compréhensibles par les humains, augmentant ainsi la confiance et la responsabilité.
Exemple : Une IA de diagnostic médical qui fournit non seulement une recommandation, mais explique également quels symptômes ont conduit à cette conclusion.

Apprentissage Few-shot (Few-shot Learning)

Few-shot Learning
Une méthode d'apprentissage automatique où un modèle est entraîné ou affiné en utilisant seulement un petit nombre d'exemples étiquetés.
Exemple : Personnaliser un LLM pour rédiger des e-mails juridiques après lui avoir montré seulement 10 exemples.

Fine-tuning (Fine-tuning)

Fine-tuning
Le processus consistant à prendre un modèle pré-entraîné et à le former davantage sur un nouveau jeu de données plus petit pour le spécialiser dans une tâche spécifique.
Exemple : Affiner un LLM général comme GPT sur des documents juridiques internes pour créer un assistant de rédaction juridique.

Modèle de Fondation (Foundation Model)

Foundation Model
Un modèle à grande échelle entraîné sur des données diverses et larges qui peut être adapté à de nombreuses tâches en aval.
Exemple : GPT-4 et PaLM 2 sont des modèles de fondation capables de résumer, de répondre à des questions, de traduire, etc.

Logique Floue (Fuzzy Logic)

Fuzzy Logic
Une forme de logique qui traite de valeurs approximatives au lieu de la logique binaire vrai/faux, utile pour le raisonnement sous incertitude.
Exemple : Utilisé dans les systèmes de contrôle climatique pour ajuster la température en fonction d'entrées floues comme « un peu chaud » ou « très froid ».

Réseau Génératif Antagoniste (GAN) (Generative Adversarial Network (GAN))

Generative Adversarial Network (GAN)
Une architecture de modèle génératif où deux réseaux — un générateur et un discriminateur — s'affrontent pour améliorer la qualité de la sortie.
Exemple : Les GAN sont utilisés pour créer des vidéos deepfake ou générer des photos de produits réalistes à partir d'esquisses.

IA Générative (Generative AI)

Generative AI
Une catégorie d'intelligence artificielle capable de créer du nouveau contenu — tel que du texte, des images, de la musique ou de la vidéo — à partir de données d'entraînement.
Exemple : ChatGPT générant des articles de blog ou Midjourney créant des œuvres d'art numériques à partir d'invites textuelles.

Transformeur Génératif Pré-entraîné (GPT) (Generative Pre-trained Transformer (GPT))

Generative Pre-trained Transformer (GPT)
Une classe de grands modèles linguistiques développés par OpenAI qui utilise une architecture de transformeur et est pré-entraînée sur de vastes quantités de données textuelles pour effectuer une variété de tâches linguistiques.
Exemple : GPT-4 est capable de rédiger des essais, de traduire des langues et de résumer des documents avec des invites minimales.

Algorithme Génétique (Genetic Algorithm)

Genetic Algorithm
Une technique d'optimisation inspirée par la sélection naturelle où les solutions évoluent avec le temps par mutation, croisement et sélection.
Exemple : Utilisé pour concevoir des architectures de réseaux neuronaux efficaces en simulant la survie du plus apte.

Hallucination (Hallucination)

Hallucination
La génération de contenu plausible mais factuellement incorrect ou absurde par un modèle d'IA.
Exemple : Un modèle linguistique invente une citation inexistante ou fournit de faux faits historiques.

Heuristique (Heuristic)

Heuristic
Une approche pratique de résolution de problèmes qui ne garantit pas une solution parfaite mais est suffisante pour les objectifs immédiats.
Exemple : Utiliser une règle empirique pour estimer le temps de livraison dans un système d'IA logistique.

Hyperparamètre (Hyperparameter)

Hyperparameter
Une valeur de configuration définie avant l'entraînement d'un modèle d'apprentissage automatique, telle que le taux d'apprentissage ou le nombre de couches.
Exemple : Ajuster la taille du lot de 32 à 128 pour améliorer la vitesse d'entraînement et les performances du modèle.

Inférence (Inference)

Inference
Le processus d'utilisation d'un modèle d'apprentissage automatique entraîné pour faire des prédictions ou générer des sorties à partir de nouvelles données d'entrée.
Exemple : Utiliser un modèle GPT affiné pour rédiger des e-mails pour une équipe de support client.

Détection d'Intention (Intent Detection)

Intent Detection
Une tâche en compréhension du langage naturel où le système identifie le but ou l'objectif de l'utilisateur dans un message.
Exemple : Dans un chatbot, reconnaître « Je veux réserver un vol » comme une intention de réservation de voyage.

Internet des Objets (IoT) (Internet of Things (IoT))

Internet of Things (IoT)
Un réseau d'appareils physiques interconnectés intégrant des capteurs, des logiciels et d'autres technologies pour collecter et échanger des données.
Exemple : Des thermostats et réfrigérateurs intelligents qui rapportent les données d'utilisation et ajustent les paramètres à l'aide d'analyses IA.

Interprétabilité (Interpretability)

Interpretability
La mesure dans laquelle un humain peut comprendre les mécanismes internes d'un modèle d'apprentissage automatique et son processus de prise de décision.
Exemple : Un arbre de décision est plus interprétable qu'un réseau neuronal profond car ses décisions sont traçables.

Jupyter Notebook (Jupyter Notebook)

Jupyter Notebook
Un environnement informatique interactif open-source qui permet aux utilisateurs d'écrire du code, de visualiser des sorties et de documenter des analyses dans une seule interface.
Exemple : Les scientifiques des données utilisent des Jupyter Notebooks pour prototyper des modèles d'apprentissage automatique et partager des résultats.

K-Plus Proches Voisins (KNN) (K-Nearest Neighbours (KNN))

K-Nearest Neighbours (KNN)
Un algorithme d'apprentissage automatique simple et non paramétrique utilisé pour la classification et la régression. Il prend des décisions basées sur les exemples d'entraînement les plus proches dans l'espace des caractéristiques.
Exemple : Pour classer un nouveau fruit comme une pomme ou une poire, KNN vérifie quels fruits étiquetés sont les plus proches en forme et en couleur.

Graphe de Connaissances (Knowledge Graph)

Knowledge Graph
Une structure de données qui utilise des nœuds et des arêtes pour représenter et stocker des descriptions interconnectées d'entités et de leurs relations.
Exemple : Le panneau de connaissances de Google est alimenté par un graphe de connaissances qui relie des entités comme les personnes, les lieux et les événements.

Optimisation des Modèles d'Apprentissage Linguistique (LLMO) (Language Learning Model Optimisation (LLMO))

Language Learning Model Optimisation (LLMO)
Des techniques utilisées pour améliorer les performances, l'efficacité ou l'adaptabilité des grands modèles linguistiques pour des tâches ou des domaines spécifiques.
Exemple : Utiliser la quantification et le réglage des instructions pour optimiser un LLM pour une utilisation en entreprise.

Modèle de Langage Large (LLM) (Large Language Model (LLM))

Large Language Model (LLM)
Un type de modèle d'apprentissage profond entraîné sur de vastes quantités de données textuelles, capable de générer, comprendre et raisonner avec le langage humain.
Exemple : ChatGPT et Claude sont des LLM entraînés pour aider à la rédaction, au codage et à la réponse aux questions.

Espace Latent (Latent Space)

Latent Space
Une représentation abstraite de haute dimension où les entrées similaires sont regroupées étroitement, utilisée dans les modèles génératifs et les embeddings.
Exemple : Dans la génération d'images, la manipulation de l'espace latent peut modifier des caractéristiques comme la luminosité ou l'émotion.

Taux d'Apprentissage (Learning Rate)

Learning Rate
Un hyperparamètre clé dans l'entraînement qui contrôle la mesure dans laquelle les poids du modèle sont ajustés par rapport au gradient de perte.
Exemple : Un taux d'apprentissage élevé peut entraîner un dépassement des minima, tandis qu'un taux trop bas ralentit la progression de l'entraînement.

Apprentissage Automatique (ML) (Machine Learning (ML))

Machine Learning (ML)
Une branche de l'IA qui permet aux systèmes d'apprendre à partir de données et d'améliorer leurs performances sans être explicitement programmés.
Exemple : Les filtres anti-spam utilisent l'apprentissage automatique pour classer les e-mails comme spam ou non, sur la base d'exemples passés.

Dérive du Modèle (Model Drift)

Model Drift
Un phénomène où la précision d'un modèle diminue avec le temps en raison de changements dans les données ou l'environnement.
Exemple : Un modèle de détection de fraude devient moins précis à mesure que les tactiques de fraude évoluent.

Entraînement du Modèle (Model Training)

Model Training
Le processus consistant à alimenter des données à un modèle d'apprentissage automatique et à ajuster ses paramètres pour minimiser l'erreur.
Exemple : Entraîner un moteur de recommandation sur l'historique d'achat des clients pour suggérer de nouveaux produits.

IA Multimodale (Multimodal AI)

Multimodal AI
Des systèmes d'IA capables de traiter et d'intégrer plusieurs types de données tels que le texte, les images, l'audio et la vidéo.
Exemple : Un modèle comme GPT-4 Vision qui peut lire du texte et interpréter des images en même temps.

Traitement du Langage Naturel (NLP) (Natural Language Processing (NLP))

Natural Language Processing (NLP)
Un sous-domaine de l'IA axé sur l'interaction entre les ordinateurs et les langages humains (naturels). Il permet aux machines de lire, comprendre et répondre en langage humain.
Exemple : Le NLP est utilisé dans les assistants vocaux, les applications de traduction linguistique et les chatbots.

Réseau Neuronal (Neural Network)

Neural Network
Un modèle d'apprentissage automatique inspiré de la structure du cerveau humain, composé de couches de nœuds interconnectés (neurones).
Exemple : Les réseaux neuronaux sont à la base des modèles d'apprentissage profond utilisés dans la reconnaissance d'images et de la parole.

Bruit (Noise)

Noise
Informations aléatoires ou non pertinentes dans les données qui peuvent masquer des motifs significatifs et affecter négativement les performances du modèle.
Exemple : Les erreurs de capteur ou les entrées de données contenant des fautes de frappe peuvent être considérées comme du bruit.

Ontologie (Ontology)

Ontology
Un cadre structuré qui catégorise et définit les relations entre les concepts d'un domaine, souvent utilisé dans les systèmes d'IA sémantique.
Exemple : Une ontologie dans le domaine de la santé pourrait définir comment les symptômes sont liés aux maladies et aux traitements.

Surapprentissage (Overfitting)

Overfitting
Une erreur de modélisation où un modèle d'apprentissage automatique capture le bruit dans les données d'entraînement et obtient de mauvais résultats sur de nouvelles données.
Exemple : Un modèle qui mémorise les réponses d'entraînement mais ne peut pas gérer des données inédites est en surapprentissage.

Analyse Prédictive (Predictive Analytics)

Predictive Analytics
L'utilisation de données, d'algorithmes et d'IA pour identifier la probabilité des résultats futurs basés sur des données historiques.
Exemple : Les détaillants utilisent l'analyse prédictive pour prévoir la demande de certains produits.

Pré-entraînement (Pre-training)

Pre-training
Le processus de formation initiale d'un modèle sur un grand jeu de données général avant de l'affiner pour des tâches spécifiques.
Exemple : Les modèles GPT sont pré-entraînés sur de grands corpus avant d'être personnalisés pour des chatbots de service client.

Ingénierie des Prompts (Prompt Engineering)

Prompt Engineering
L'art et la science de la création d'invites efficaces pour orienter la sortie des grands modèles linguistiques.
Exemple : Ajouter des instructions système comme « Répondez en tant que tuteur poli » est un exemple d'ingénierie des prompts.

Quantification (Quantisation)

Quantisation
Une technique de compression de modèle qui réduit le nombre de bits utilisés pour représenter les poids et les activations, améliorant ainsi l'efficacité.
Exemple : Quantifier un modèle de 32 bits à 8 bits améliore les performances sur les appareils mobiles.

Informatique Quantique (Quantum Computing)

Quantum Computing
Un nouveau paradigme de calcul basé sur la mécanique quantique, qui offre un potentiel de capacités de traitement exponentielles.
Exemple : L'informatique quantique pourrait un jour accélérer l'entraînement de l'IA au-delà des limites classiques.

Moteur de Raisonnement (Reasoning Engine)

Reasoning Engine
Un système d'IA qui déduit des conclusions logiques à partir d'un ensemble de faits ou de données en utilisant des règles ou des algorithmes d'inférence.
Exemple : Un outil de diagnostic IA utilise un moteur de raisonnement pour déduire les conditions médicales possibles en fonction des symptômes.

Apprentissage par Renforcement (RL) (Reinforcement Learning (RL))

Reinforcement Learning (RL)
Un domaine de l'apprentissage automatique où les agents apprennent en interagissant avec leur environnement pour maximiser les récompenses cumulatives.
Exemple : Un robot apprenant à marcher par essais et erreurs en utilisant des techniques de RL.

Apprentissage par Renforcement avec Rétroaction Humaine (RLHF) (Reinforcement Learning with Human Feedback (RLHF))

Reinforcement Learning with Human Feedback (RLHF)
Une méthode d'apprentissage où les préférences humaines guident le signal de récompense de l'IA, souvent utilisée pour affiner les modèles linguistiques.
Exemple : ChatGPT a été entraîné avec RLHF pour produire des réponses plus utiles et sûres.

Génération Augmentée par Récupération (RAG) (Retrieval-Augmented Generation (RAG))

Retrieval-Augmented Generation (RAG)
Une méthode combinant la récupération d'informations avec la génération, où un LLM récupère des documents pertinents pour améliorer sa réponse.
Exemple : Un assistant IA récupère et cite des spécifications de produits tout en générant une réponse à une question technique.

Apprentissage Auto-supervisé (Self-Supervised Learning)

Self-Supervised Learning
Une approche d'entraînement où le modèle apprend des motifs en générant ses propres étiquettes à partir de données brutes, réduisant ainsi la dépendance aux données annotées par l'homme.
Exemple : BERT est entraîné avec l'apprentissage auto-supervisé en prédisant les mots manquants dans le texte.

Recherche Sémantique (Semantic Search)

Semantic Search
Une technique de recherche qui comprend l'intention de l'utilisateur et le sens contextuel, pas seulement la correspondance de mots-clés.
Exemple : Rechercher « comment réparer un robinet qui fuit » renvoie des guides même si le terme « robinet qui fuit » n'est pas présent dans le document.

Analyse de Sentiment (Sentiment Analysis)

Sentiment Analysis
Le processus d'identification des émotions, opinions ou attitudes dans le texte, le classant souvent comme positif, négatif ou neutre.
Exemple : Analyser des tweets pour évaluer la réaction du public à un nouveau produit.

Stochastique (Stochastic)

Stochastic
Impliquant un comportement aléatoire ou probabiliste, souvent utilisé dans l'IA générative et les algorithmes d'optimisation.
Exemple : La sortie de GPT-4 varie pour la même entrée en raison de son processus de décodage stochastique.

IA Forte (Strong AI)

Strong AI
Également connue sous le nom d'Intelligence Artificielle Générale (IAG), fait référence à des machines ayant des capacités cognitives de niveau humain dans tous les domaines.
Exemple : Une IA future capable d'écrire de manière autonome des romans, de planifier des villes et de résoudre des dilemmes éthiques de manière égale.

Super Intelligence Artificielle (SAI) (Super Artificial Intelligence (SAI))

Super Artificial Intelligence (SAI)
Une IA théorique surpassant largement l'intelligence humaine dans tous les aspects : raisonnement, créativité, intelligence émotionnelle, etc.
Exemple : Une SAI pourrait théoriquement développer de nouvelles sciences et philosophies de manière indépendante.

Apprentissage Supervisé (Supervised Learning)

Supervised Learning
Une technique d'apprentissage automatique où les modèles sont entraînés sur des données étiquetées pour apprendre des correspondances entrée-sortie.
Exemple : Apprendre à un modèle à classer les e-mails comme spam ou non en utilisant des exemples historiques.

Données Synthétiques (Synthetic Data)

Synthetic Data
Données générées artificiellement qui simulent des données du monde réel, souvent utilisées pour l'entraînement lorsque les données réelles sont rares ou sensibles.
Exemple : Créer des images médicales synthétiques pour entraîner des modèles de diagnostic sans violer la confidentialité des patients.

Jeton (Token)

Token
Une unité de texte traitée par les LLM — généralement un mot ou un sous-mot.
Exemple : La phrase « Bonjour le monde ! » est divisée en 3 jetons : « Bonjour », « le » et « monde ! ».

Tokenisation (Tokenisation)

Tokenisation
Le processus de décomposition du texte en jetons pour le traitement par un modèle.
Exemple : En NLP, « ChatGPT est génial » devient [« Chat », « G », « PT », « est », « génial »].

Apprentissage par Transfert (Transfer Learning)

Transfer Learning
Utiliser les connaissances d'une tâche pour améliorer l'apprentissage d'une autre tâche connexe, réduisant ainsi le temps d'entraînement et les besoins en données.
Exemple : Affiner un modèle entraîné sur du texte anglais pour effectuer une analyse de sentiment dans une autre langue.

Transformeur (Transformer)

Transformer
Une architecture de réseau neuronal qui utilise des mécanismes d'attention pour modéliser des données séquentielles, largement utilisée dans les LLM.
Exemple : BERT, GPT et T5 sont tous des modèles basés sur des transformeurs.

Sous-apprentissage (Underfitting)

Underfitting
Lorsque un modèle est trop simpliste pour capturer les motifs dans les données d'entraînement, ce qui entraîne de mauvaises performances.
Exemple : Un modèle linéaire essayant de prédire des classifications d'images complexes peut sous-apprendre.

Apprentissage Non Supervisé (Unsupervised Learning)

Unsupervised Learning
Une approche d'apprentissage où les modèles identifient des motifs ou des clusters dans des données non étiquetées.
Exemple : Regrouper des clients en fonction de leur comportement d'achat sans étiquettes prédéfinies.

Intention Utilisateur (User Intent)

User Intent
Le but ou l'objectif derrière une requête ou une interaction de l'utilisateur.
Exemple : Un utilisateur tapant « comment cuire un gâteau » a probablement l'intention de trouver une recette.

Ensemble de Validation (Validation Set)

Validation Set
Un sous-ensemble de données utilisé pour évaluer les performances du modèle pendant l'entraînement et ajuster les hyperparamètres.
Exemple : Utilisé pour détecter le surapprentissage avant les tests finaux.

Base de Données Vectorielle (Vector Database)

Vector Database
Une base de données conçue pour stocker et rechercher des embeddings vectoriels utilisés dans les tâches d'IA comme la recherche de similarité et RAG.
Exemple : Pinecone et Weaviate sont des bases de données vectorielles pour stocker des embeddings de texte ou d'image.

Embedding Vectoriel (Vector Embedding)

Vector Embedding
Une représentation numérique des données qui préserve la signification sémantique et les relations dans un espace vectoriel.
Exemple : Les mots « roi » et « reine » ont des embeddings similaires avec de subtiles différences de genre.

Assistant Virtuel (Virtual Assistant)

Virtual Assistant
Un agent logiciel alimenté par l'IA qui aide les utilisateurs à accomplir des tâches par conversation ou commandes vocales.
Exemple : Siri, Alexa et Google Assistant sont des assistants virtuels populaires.

Reconnaissance Vocale (Voice Recognition)

Voice Recognition
Technologie qui interprète et convertit le langage parlé en texte ou en action.
Exemple : La saisie vocale et les commandes vocales reposent sur des systèmes de reconnaissance vocale.

IA Faible (Weak AI)

Weak AI
Des systèmes d'IA conçus pour effectuer une tâche spécifique et étroite sans intelligence générale.
Exemple : Une IA jouant aux échecs qui ne peut pas comprendre le langage ou conduire une voiture est un exemple d'IA faible.

Web Scraping (Web Scraping)

Web Scraping
Extraction automatisée d'informations à partir de sites Web, souvent utilisée pour collecter des données d'entraînement ou surveiller du contenu.
Exemple : Scraper des annonces immobilières pour entraîner un modèle d'évaluation immobilière.

Poids (Weight)

Weight
Un paramètre dans les réseaux neuronaux qui détermine la force d'influence d'un nœud sur un autre.
Exemple : Les poids sont ajustés pendant l'entraînement pour minimiser l'erreur du modèle.

Whisper (Whisper)

Whisper
Un modèle de parole à texte développé par OpenAI capable de transcrire l'audio dans plusieurs langues.
Exemple : Whisper peut transcrire des conférences et des podcasts avec une grande précision.

YAML (YAML)

YAML
Un format lisible par l'homme pour la sérialisation des données, couramment utilisé pour les fichiers de configuration dans les flux de travail d'apprentissage automatique.
Exemple : Définir les paramètres du modèle dans un fichier YAML pour l'entraînement dans PyTorch.

Apprentissage Zero-shot (Zero-shot Learning)

Zero-shot Learning
La capacité d'un modèle à effectuer des tâches sur lesquelles il n'a jamais été explicitement entraîné en tirant parti de connaissances générales.
Exemple : Un modèle répondant à des questions juridiques sans avoir été spécifiquement entraîné sur des données juridiques.

Zettaoctet (Zettabyte)

Zettabyte
Une unité de données numériques égale à un sextillion (10^21) d'octets, souvent utilisée pour décrire l'échelle des données Internet.
Exemple : Le trafic mondial sur Internet a dépassé 1 zettaoctet par an en 2016.