LEXIQUE

IA Documentaire

Branche de l’intelligence artificielle spécialisée dans l’analyse, l’interprétation et l’exploitation automatisée des documents (structurés ou non). Elle permet de classer, extraire, comprendre et traiter l’information contenue dans des documents divers.

VLM

(Vision-Language Model) : Modèle qui combine traitement d’image et langage naturel. Il permet d’interpréter un document visuel (ex. : facture scannée) et d’en extraire du sens textuel (annotations, réponses, synthèses).

Classification documentaire

Capacité à identifier automatiquement le type d’un document (facture, contrat, courrier, etc.).

Analyse de cohérence

Comparaison de contenus (ex. : diagnostics, recommandations) pour vérifier leur logique ou repérer des anomalies.

Hallucination

Phénomène où un modèle génératif (LLM) produit des informations incorrectes, inventées ou hors contexte, tout en paraissant crédible. Problème critique pour lafiabilité de l’extraction des données d’un doucment dans un cadre métier

Intelligent Document Processing (IDP)

Ensemble de technologies combinant OCR, Intelligence Artificielle, NLP (traitement du langage naturel) et parfois RPA (automatisation robotisée des processus), destiné à automatiser le traitement des documents. L’IDP permet de capturer, classer, extraire et structurer les données issues de documents variés (PDF, images, formulaires, etc.), réduisant fortement les tâches manuelles et améliorant la fiabilité des traitements.

NLP

Traitement automatique du langage naturel. Branche de l’IA qui permet à une machine de comprendre, interpréter, générer ou résumer du texte en langage humain. En IA documentaire, le NLP est utilisé pour extraire des informations, détecter des intentions, résumer des contenus ou analyser la sémantique des documents.

Computer Vision

Domaine de l’IA qui permet à une machine de “voir” et d’interpréter le contenu visuel. Dans l’IA documentaire, elle est utilisée pour repérer des zones clés (blocs de texte, signatures, tampons, tableaux…

OCR

(Reconnaissance Optique de Caractères) : Technologie qui convertit des documents scannés ou photographiés (PDF, images) en texte exploitable par une machine. Étape clé en amont du traitement IA.

Extraction de données (Data extraction)

Processus d’identification et d’extraction automatique de champs spécifiques dans un document (montants, dates, noms, etc.).

Fine-tuning

Ajustement d’un modèle IA sur un corpus ou des cas d’usage spécifiques pour améliorer sa pertinence métier.

Workflow documentaire

Enchaînement automatisé des étapes de traitement d’un document au sein d’une organisation (validation, signature, classement, notification, etc.). L’IA peut enrichir ces workflows en déclenchant automatiquement des actions à partir du contenu analysé (ex. : routage d’un courrier, alerte sur une anomalie, déclenchement d’un processus métier).

LLM

(Large Language Model) Modèle de langage entraîné sur de très grands volumes de texte. Il comprend, génère et complète des contenus textuels en langage naturel (ex. : GPT-4, Claude, PaLM). Utilisé pour résumer, classer, extraire des données ou répondre à des requêtes.

Indexation sémantique

Enrichissement des documents à partir de mots-clés ou concepts automatiquement détectés, pour faciliter la recherche intelligente

Zero Shot Learning

Capacité d’un modèle à exécuter une tâche sans (ou avec très peu de) données d’entraînement spécifiques.

Système d'Information documentaire (SID)

Ensemble des logiciels, bases de données et outils utilisés pour gérer, stocker, organiser et restituer l’information documentaire d’une organisation.

Auditabilité

Capacité à retracer les décisions ou extractions faites par un système IA, notamment pour des questions de conformité ou de transparence.

GED

(Gestion Électronique de Documents) : Système permettant de stocker, organiser, rechercher, partager et archiver des documents numériques de manière centralisée. Une GED moderne intègre souvent des fonctions d’IA documentaire (comme l’indexation automatique ou la recherche sémantique) pour améliorer l’accessibilité et l’exploitation de l’information.