Extraire des factures PDF vers Excel : guide France

La méthode pratique pour extraire des factures PDF vers Excel est d'utiliser un extracteur IA/OCR qui lit l'identité fournisseur, le SIRET, le numéro de facture, les dates, les taux et montants HT/TVA/TTC, l'IBAN et les lignes de facture, puis exporte un fichier Excel ou CSV structuré. C'est ce que cherche un comptable qui ouvre un dossier de factures fournisseurs en début de mois et veut une feuille propre, prête à contrôler ou à importer dans son outil de tenue.

L'instinct est souvent d'aller au plus simple : ouvrir Adobe en ligne, Smallpdf ou l'import PDF natif d'Excel et lancer une conversion PDF-vers-Excel. Ça fonctionne sur un PDF tabulaire fabriqué pour ça, ça casse dès qu'on lance un vrai lot. Deux raisons : la mise en page d'une facture varie d'un fournisseur à l'autre (en-têtes multibloc, totaux en pied de page, conditions de règlement intercalées, lignes de facture qui débordent sur plusieurs pages) et beaucoup de factures arrivent en scan ou en photo, donc sans couche texte. Un convertisseur générique cherche des cellules de tableau, pas des champs comptables ; il ne sait pas reconnaître un SIRET, ne distingue pas montant HT et montant TTC, ne ventile pas la TVA par taux. Le problème n'est pas de convertir le PDF, c'est de comprendre la facture.

C'est là qu'un OCR de factures fournisseurs orienté Excel change la donne. La reconnaissance OCR couvre les scans et les photos, le moteur IA identifie les champs au bon endroit indépendamment de la grille visuelle, et le lot mixte PDF natifs + scans + images est traité d'un coup. Surtout, on choisit les colonnes à produire au lieu de subir un format figé : ventilation multi-taux TVA, IBAN et BIC pour les règlements, lignes de facture quand on en a besoin, références de fichier et de page pour revenir au document d'origine sur les montants douteux. C'est ce qui permet de passer durablement de factures fournisseurs vers Excel sans repasser derrière manuellement à chaque clôture.

Le reste de l'article descend dans les champs qu'attend la saisie comptable française, le schéma de colonnes adapté à la destination, et la vérification depuis la page source — les deux derniers points étant ceux où les outils du marché diffèrent vraiment.

Les champs qui comptent dans une facture fournisseur française

Avant de parler outil, il faut être au clair sur ce que la sortie tableur doit contenir pour extraire les données d'une facture PDF utilement. Lister les champs en vrac ne suffit pas : chacun sert un usage précis dans la chaîne de traitement, et c'est ce qui détermine la qualité d'un extracteur, pas le nombre de cases qu'il sait lire.

Identité fournisseur, SIRET et numéro de TVA intracommunautaire. La raison sociale exacte conditionne le rapprochement avec le compte 401 du fournisseur dans la balance auxiliaire ; un fournisseur saisi avec une orthographe légèrement différente devient un nouveau tiers et casse le suivi. Le SIRET (et le SIREN à défaut) sert à fiabiliser cette identification et à détecter les doublons quand un même fournisseur apparaît sous deux libellés. La mention du numéro de TVA intracommunautaire, quand elle figure, est ce qui permet de traiter correctement les factures de prestataires européens en autoliquidation.

Numéro de facture, date de facture, date d'échéance. La trilogie minimale, sans laquelle il n'y a pas d'écriture comptable possible et pas de suivi des règlements. Les formats varient beaucoup : numéros alphanumériques avec préfixe, dates au format français jj/mm/aaaa, parfois écrites en lettres, parfois en anglais sur les fournisseurs étrangers. L'extracteur doit normaliser tout ça vers un format unique côté tableur, typiquement AAAA-MM-JJ pour les dates, et préserver le numéro de facture tel qu'émis.

TVA et montants HT/TVA/TTC par taux. C'est le champ qui sépare un convertisseur générique d'un extracteur orienté factures. Une facture française multi-taux ventile naturellement entre 5,5 %, 10 % et 20 %, plus 0 % pour les achats intracommunautaires en autoliquidation. Prenons un fournisseur de restauration qui livre dans la même facture des boissons soft à 20 %, des produits alimentaires à 5,5 % et une prestation de livraison à 10 %. La sortie utile ne montre pas un seul total TVA, elle montre les trois bases HT et les trois montants de TVA séparés, sinon la saisie comptable est fausse dès l'import et la déclaration de TVA aussi. Le tableur doit donc prévoir des colonnes par taux ou un schéma ligne par ligne avec le taux porté sur chaque ligne.

IBAN, BIC et références de paiement. Pas pour la saisie d'écriture, mais pour préparer les règlements et tenir une fiche fournisseur cohérente. Vérifier l'IBAN avant un virement évite les paiements à un compte erroné quand un fournisseur change de banque ; archiver la référence de paiement attendue (numéro de bon de commande, référence client) facilite la justification ultérieure.

Lignes de facture : description, quantité, prix unitaire, total ligne, taux TVA par ligne. Le choix entre « une ligne par facture » et « une ligne par ligne de facture » dépend de l'usage. Une ligne par facture suffit pour une saisie globale au compte de charges (le comptable impute le total HT au 60x choisi et passe la TVA). Une ligne par ligne de facture devient indispensable pour l'analyse de la dépense par poste, la valorisation de stocks dans le négoce et la restauration, le contrôle des écarts avec un bon de commande, ou la ventilation analytique par centre de coût. Le même lot de PDF peut produire les deux schémas, ce n'est qu'une question de prompt.

Compte de charges suggéré. Un extracteur IA peut proposer une pré-imputation 60x/61x/62x à partir du libellé du fournisseur et de la description des lignes : 601 pour les achats de marchandises, 606 pour les fournitures non stockables, 622 pour les honoraires et prestations externes, 625 pour les frais de déplacement. C'est une suggestion, pas une imputation opposable, et le comptable la valide ou la corrige. L'intérêt n'est pas d'automatiser l'imputation ; c'est de gagner les quelques secondes par facture qui s'accumulent sur un lot de plusieurs centaines.

Référence fichier source et numéro de page. Le champ qui transforme un tableur en outil de contrôle. Sans pont retour vers le PDF d'origine, on extrait des données ; avec lui, on extrait des données vérifiables. Sur un lot de quelques centaines de factures, c'est ce qui fait la différence entre une feuille qu'on peut signer et une feuille qu'on doit redouter d'importer.

Concevoir le schéma de colonnes selon la destination comptable

Le piège de la plupart des outils du marché est de proposer un schéma de colonnes figé : « Numéro, Date, Fournisseur, Total ». Le même lot de factures fournisseurs alimente pourtant des tableurs très différents selon ce qu'on en fait derrière. Avant de lancer une extraction, la première question utile est : pour qui produit-on ce fichier ?

Trois destinations typiques structurent trois schémas distincts.

Envoi à l'expert-comptable. Le cabinet attend généralement un fichier qui ressemble à un brouillard d'écritures, ou au moins qui s'en rapproche assez pour qu'il l'intègre rapidement. Les colonnes pertinentes sont alors :

Date facture (AAAA-MM-JJ)
Date échéance
Numéro de facture
Fournisseur (raison sociale)
SIRET
Compte fournisseur 401XXX
Compte de charges suggéré
Libellé écriture
Montant HT
Taux TVA
Montant TVA
Montant TTC
Devise
Référence fichier
Page

Une ligne par facture, dates en texte normalisé, taux en pourcentage natif, montants à deux décimales : l'objectif est qu'il puisse lire la feuille, valider ou corriger les imputations, et passer à l'écriture sans repasser sur chaque PDF.

Import direct dans un outil de tenue. Pennylane, Cegid, EBP, Sage : chacun a son format de colonnes attendu, parfois son ordre imposé, ses règles sur les dates et les montants. Le schéma de colonnes du tableur doit coller à ce gabarit avant import, sinon on perd la moitié du temps gagné en post-traitement Excel. C'est typiquement après cette étape d'extraction qu'intervient le travail d'importer un lot de factures fournisseurs dans Pennylane depuis Excel : la sortie de l'extracteur doit déjà être au bon format pour que l'import passe en un seul mouvement.

Tableau interne de contrôle. Plus large, souvent ligne par ligne de facture, il sert au pilotage interne : analyse de dépense par poste, valorisation de stocks, contrôle d'écart avec le bon de commande, ventilation analytique. Un schéma utile ressemble à :

Numéro de facture (répété sur chaque ligne)
Fournisseur
Date facture
Description article
Quantité
Prix unitaire HT
Total ligne HT
Taux TVA ligne
Catégorie de dépense
Centre de coût
Référence fichier
Page

Ce schéma sert un usage différent de la saisie comptable, et c'est précisément pourquoi un schéma figé ne peut pas couvrir les deux. Les besoins de pilotage ne se déduisent pas du brouillard d'écritures, et inversement.

Le point qui rend l'opération viable est qu'un extracteur prompt-driven permet de basculer d'un schéma à l'autre sans rejouer l'OCR sur le lot. On modifie la description des colonnes attendues, on relance, on récupère un nouveau tableur : le travail de reconnaissance des champs sur les PDF a déjà été fait. C'est la différence pratique avec un convertisseur à schéma fixe, qui force à se contenter de ses colonnes ou à exporter en Excel pour les retravailler manuellement.

En pratique, beaucoup de cabinets finissent par produire les deux schémas en parallèle à partir du même lot : un fichier d'import pour la tenue comptable, un fichier de contrôle pour le client, à partir des mêmes PDF. Si l'objectif est seulement de convertir factures fournisseurs en Excel pour archivage, n'importe quel schéma simple convient ; si l'objectif est d'aller plus loin et d'extraire lignes de facture en Excel pour un usage analytique, le schéma ligne par ligne devient incontournable et la définition des colonnes mérite quelques minutes de préparation avant l'extraction.

Le déroulé concret : importer le lot, décrire les colonnes, exporter

Le geste est court parce qu'il tient en un écran : une zone de dépôt de fichiers et un champ de prompt. Voici comment il se déroule sur un dossier mensuel typique.

1. L'import du lot. On dépose tout d'un coup : les PDF natifs envoyés par les fournisseurs qui émettent via un ERP, les scans de factures papier passées au scanner du bureau, les photos prises au smartphone pour les justificatifs de déplacement, les pièces jointes reçues par mail. Aucun pré-tri par format, aucune conversion préalable. Le lot peut mélanger fichiers d'une seule page et PDF multipages contenant plusieurs factures concaténées, ou une seule facture étalée sur plusieurs pages de lignes.

2. Le prompt qui décrit la sortie. On écrit en français ce que doit produire l'extracteur, en vocabulaire comptable habituel. Un exemple court et réaliste pour un schéma de saisie comptable :

Extraire pour chaque facture : Fournisseur, SIRET, Numéro de facture, Date facture (AAAA-MM-JJ), Date échéance, Montant HT, Taux TVA, Montant TVA, Montant TTC, IBAN. Une ligne par facture. Si plusieurs taux de TVA sur la même facture, ventiler en colonnes HT_5_5, TVA_5_5, HT_10, TVA_10, HT_20, TVA_20.

Pour un schéma de contrôle interne ligne par ligne, le prompt change légèrement : on demande une ligne par ligne de facture avec description, quantité, prix unitaire, total ligne et taux TVA de ligne, en répétant le numéro de facture et le fournisseur sur chaque ligne. Le même lot d'origine peut produire les deux sorties.

3. L'exécution sur le lot entier. L'extracteur de factures par IA d'Invoice Data Extraction lit chaque document du lot, identifie les champs même quand la mise en page change radicalement entre un fournisseur SaaS qui émet via Stripe et un artisan dont la facture vient d'un modèle Word. La même grille de colonnes s'applique à tout le lot. L'IA produit des notes d'extraction qui documentent les choix faits sur les cas ambigus : taux TVA inféré quand il n'est pas écrit en clair, ligne traitée comme remise commerciale, montant en devise étrangère, page identifiée comme accusé de réception et ignorée. Ces notes sont la trace explicative qu'on relit en cas de doute.

L'interface elle-même est un champ de prompt et une zone de dépôt de fichiers, le même geste qu'utiliser ChatGPT ou Claude. Pas de modèles à configurer, pas d'assistant en plusieurs étapes, pas de règles métier à paramétrer. Le prompt est la configuration. Cela permet d'aller au volume qui sert vraiment un cabinet : jusqu'à 6 000 fichiers par lot, ou un PDF unique jusqu'à 5 000 pages quand on traite un état archivé qui concatène toute une année. Sur un job de plus de 500 documents, le rythme tourne autour de deux secondes par page.

4. L'export. On récupère un fichier au format choisi : Excel (.xlsx) pour la vérification manuelle directe et l'usage Office classique, CSV (.csv) pour les imports comptables exigeants en format, JSON (.json) quand l'étape suivante est une chaîne d'automatisation ou une intégration dans un autre système. Le tableur ouvre tel quel : numéros typés comme nombres, dates typées comme dates ou comme texte selon ce qui a été demandé dans le prompt, taux TVA en pourcentage natif, devises avec deux décimales. Chaque ligne porte la référence du fichier source et le numéro de page concerné.

Le geste qui clôt l'opération est court : on ouvre le tableur, on parcourt les lignes signalées par les notes d'extraction, on revient au PDF source quand un montant ne paraît pas cohérent. Le détail de ce contrôle fait l'objet de la section suivante ; il fait partie du workflow, pas d'un correctif après coup.

Le résultat net pour un dossier de fin de mois, c'est passer d'une après-midi de saisie à un fichier prêt à valider en quelques minutes, exporter factures PDF en CSV ou Excel selon l'outil de destination, et garder une piste d'audit lisible.

Les scans, les photos, et les mises en page qui varient

C'est le terrain sur lequel la plupart des outils grand public déraillent silencieusement. Comprendre pourquoi évite de répéter les mêmes essais infructueux et explique ce qu'un extracteur orienté factures sait faire de plus.

L'import PDF natif d'Excel et les convertisseurs PDF-vers-Excel cherchent une chose : des cellules de tableau dans la couche texte du PDF. Quand le document est une facture émise par un ERP avec sa grille de lignes propre, la couche texte existe et le tableau se devine, donc l'outil renvoie quelque chose d'à peu près lisible. Dès qu'on sort de ce cas idéal, deux problèmes se cumulent. Premier problème : beaucoup de factures n'ont pas de couche texte du tout. Une facture papier scannée, une photo prise au téléphone, une copie passée par un fax virtuel : ce sont des images. Le convertisseur ne lit rien. Second problème : même quand la couche texte existe, une facture n'est pas un tableau. Elle a un en-tête multibloc avec l'identité fournisseur en haut à gauche, l'identité client à droite, le numéro et la date dans une troisième zone ; un corps central avec des lignes éventuellement imbriquées ; un pied de page avec totaux, ventilation TVA, IBAN et mentions légales. Aucun outil qui cherche des cellules de tableau ne va remettre ça en colonnes propres.

L'extraction OCR facture fournisseur change le problème de nature. La couche OCR couvre le cas des scans et des photos sans couche texte ; le moteur IA, lui, comprend la structure d'une facture indépendamment de sa grille visuelle : il sait qu'un SIRET est un nombre à 14 chiffres souvent dans le pied ou l'en-tête, qu'un total TTC est un montant qui doit égaler HT + TVA, que les lignes de facture ont une signature « description + quantité + prix unitaire + total » répétée. La différence n'est pas marginale : c'est la différence entre lire un tableau et reconnaître une facture.

Cette robustesse compte parce qu'un lot mensuel réel est presque toujours mixte. Dans le même dossier on trouve typiquement des PDF natifs propres venus d'éditeurs SaaS, des scans inégaux numérisés au bureau, des photos de tickets prises depuis le terrain, et des factures multipages avec lignes qui continuent au verso. Dans la restauration, par exemple, le même mois peut empiler des factures Metro multipages avec plusieurs centaines de lignes produit, des factures de petits maraîchers émises sur des modèles Word, et des avoirs scannés à part : voir le détail dans l'extraction des factures fournisseurs en restauration (Metro, Brake, Transgourmet, Pomona) où ce cas se présente à l'état pur. Un extracteur orienté factures applique le même schéma à tout le lot, là où la chaîne « pré-tri + conversion + nettoyage » devient ingérable au-delà de quelques dizaines de documents.

Les factures de fournisseurs intracommunautaires méritent une mention. Elles arrivent souvent en langue étrangère, avec une TVA à 0 et une mention d'autoliquidation, le numéro de TVA intracommunautaire dans le pied de page, parfois sans SIRET français du tout. Un extracteur sérieux normalise ces cas dans la même grille de colonnes que les fournisseurs nationaux : la sortie tableur affiche bien un taux 0, un montant TVA à 0, le numéro de TVA intracommunautaire dans la colonne d'identité, et la mention d'autoliquidation dans un champ dédié ou en note. La saisie comptable derrière reste correcte sans intervention manuelle ligne à ligne.

Un scan illisible reste illisible. Une photo prise dans la pénombre, une numérisation à trop basse résolution, une facture froissée avec des chiffres effacés, l'extracteur fera ce qu'il peut et produira une ligne en signalant les champs incertains. Aucun outil ne peut deviner ce qui n'est pas visible sur le document. C'est précisément parce que ces cas existent que la vérification depuis la page source, traitée dans la section suivante, fait partie intégrante du workflow et non d'une étape de rattrapage exceptionnelle.

Vérifier chaque extraction depuis la page source

La sortie tableur n'est pas l'aboutissement du workflow, c'est son point de contrôle. Aucune extraction n'est fiable à 100 %, et l'expérience comptable enseigne qu'une erreur de TVA finit en redressement et qu'une erreur d'IBAN finit en virement perdu. La question pratique n'est donc pas « comment éviter toute erreur » mais « comment les voir et les corriger en quelques minutes plutôt qu'en relisant tout ».

Les points sensibles à vérifier en priorité tiennent en quelques contrôles ciblés. Le total TTC d'une facture doit toujours égaler la somme HT + TVA, à l'arrondi près ; un écart signale soit une erreur d'extraction sur l'un des trois montants, soit une particularité dans le document d'origine (remise, frais de port, acompte) qui mérite un coup d'œil. Sur les fournisseurs multi-taux, le contrôle se porte sur la ventilation par taux : un montant TVA qui ne correspond pas à 5,5 %, 10 % ou 20 % de sa base HT indique soit un taux mal lu, soit une base mal extraite. Pour les nouveaux fournisseurs, le SIRET et le numéro de TVA intracommunautaire valent une vérification rapide ; ce sont les champs qui posent problème si on les laisse couler. Le numéro de facture sert au contrôle de doublons sur la durée. L'IBAN, lui, ne se vérifie pas en post-extraction, il se vérifie avant chaque règlement initial à un nouveau fournisseur.

Le geste concret est court. Sur chaque ligne du tableur, une référence fichier + page renvoie au PDF d'origine. On clique, on voit le document à la page concernée, on contrôle le chiffre disputé, on corrige le tableur si besoin, on passe à la suivante. C'est le même geste qu'une vérification manuelle classique, sauf que l'extracteur a déjà fait 95 % du travail et que ce qui reste tient sur quelques minutes au lieu d'une demi-journée.

La mécanique du contrôle se prolonge dans la pré-validation par l'extracteur lui-même : un extracteur sérieux signale les lignes incertaines. Champ manquant, taux TVA absent du document, total qui ne tombe pas juste, ligne traitée avec hypothèse : ces flags concentrent l'attention du contrôleur sur les bons documents. En pratique, le geste devient « relire toutes les lignes signalées, plus un échantillon aléatoire du reste », ce qui est compatible avec le rythme d'une clôture mensuelle même sur des lots conséquents.

Pour les achats stockés (restauration, négoce, distribution de matériel, distribution alimentaire), la vérification ne s'arrête pas à la facture isolée : elle se confronte au bon de livraison reçu. Quantités livrées contre quantités facturées, prix unitaire commandé contre prix unitaire facturé, écarts de remise ou de frais de port. Une sortie tableur ligne par ligne facilite directement ce travail, abordé en détail dans le rapprochement bon de livraison et facture fournisseur dans Excel. La référence fichier + page est ce qui rend ce rapprochement réalisable à l'échelle d'un mois, et pas seulement sur le dossier d'un litige.

C'est ce pont retour vers la source qui distingue un extracteur orienté factures des convertisseurs PDF génériques et de plusieurs plateformes d'OCR du marché. Quand le tableur est livré « tel quel » sans référence vers le document d'origine, le contrôle redevient une relecture intégrale et la promesse d'automatisation s'effondre dès le premier lot conséquent. Quand chaque ligne pointe sa page source, l'extracteur reste un outil sous contrôle humain, ce qui est exactement la position que la saisie comptable demande.

La réception électronique 2026 et les factures qu'il faudra encore extraire

Il vaut la peine de cadrer rapidement le sujet, parce qu'il flotte sur toute conversation autour de la facture fournisseur en ce moment, sans pour autant déplacer le problème pratique du jour.

D'après Service-Public.fr, l'obligation de recevoir les factures électroniques au 1er septembre 2026 s'applique à l'ensemble des entreprises établies en France. Concrètement, la réception passera par une plateforme agréée (PA) raccordée au portail public de facturation, en formats structurés : Factur-X (PDF avec données structurées embarquées), UBL ou CII. Pour les factures qui arrivent par ce canal, la donnée est déjà structurée à la source : pas besoin d'OCR, pas besoin d'extraction, l'outil comptable récupère un jeu de champs directement utilisable.

Ce que l'obligation ne change pas mérite d'être dit aussi clairement. Une part du flux fournisseur continuera à arriver en PDF : factures de prestataires établis à l'étranger, hors périmètre de la réforme française ; factures de micro-entrepreneurs et de structures pas encore raccordés à une plateforme agréée ; documents reçus « pour information » en dehors du canal officiel ou antérieurs à 2026. L'extraction depuis PDF reste donc nécessaire ; le volume baisse, le besoin ne disparaît pas.

Les outils d'extraction gardent aussi un rôle pendant et après la transition, même quand la réception électronique fonctionne. Une plateforme agréée livre les données structurées d'une facture, pas un fichier prêt pour l'outil comptable d'un cabinet particulier ; il y a souvent besoin de retravailler, d'ajouter de l'analytique, de réordonner les colonnes, ou de combiner les données reçues avec un bon de commande interne et un référentiel article. La possibilité de produire un tableur sous un schéma libre garde son utilité.

Pour les lecteurs qui veulent entrer plus en détail dans le workflow comptable de réception électronique (choix de la plateforme, formats, organisation des contrôles à l'arrivée), le workflow de réception des factures électroniques en 2026 traite le sujet en propre.

Comparer les catégories d'outils pour ce travail

Quatre familles d'outils s'adressent peu ou prou au même problème, avec des promesses et des limites très différentes. Les situer correctement aide à éviter le mauvais choix.

Catégorie 1 : l'import PDF natif d'Excel et les convertisseurs PDF-vers-Excel grand public. Extraction mécanique de cellules de tableau, aucune compréhension de la structure d'une facture, aucune gestion des scans sans couche texte, aucune ventilation HT/TVA/TTC par taux. Adaptés à un PDF tabulaire propre (un relevé bancaire en colonnes, par exemple), inutilisables sur un lot de factures fournisseurs hétérogène. C'est la catégorie qu'on essaie en premier par réflexe et qu'on abandonne après le premier mois.

Catégorie 2 : les OCR et extracteurs IA orientés factures. La bonne catégorie pour le travail décrit dans cet article. À l'intérieur, le marché est inégal. Les critères qui distinguent vraiment les outils utiles sont : lecture des scans et photos sans couche texte ; gestion native du multi-taux TVA et des cas intracommunautaires ; schéma de colonnes paramétrable par prompt plutôt que figé sur un modèle vendeur ; sortie XLSX, CSV et JSON ; traitement par lot à volume utile (centaines à milliers de factures) ; référence fichier + page sur chaque ligne pour la vérification ; gestion des PDF multipages et des PDF concaténant plusieurs factures.

Catégorie 3 : les suites complètes d'AP automation et de comptabilité fournisseur. Outils puissants qui pilotent l'ensemble du cycle achats : commande, réception, facture, validation, paiement, lettrage. Pertinents pour une organisation qui veut industrialiser tout le P2P, surcalibrés pour un cabinet qui a juste besoin du tableur propre ce mois-ci. Le coût d'installation et de paramétrage est sans commune mesure avec celui d'un extracteur prompt-driven, et la sortie tableur n'est pas leur cœur de métier.

Catégorie 4 : les plateformes Factur-X et la conversion compliance. Conçues pour la réception et l'émission de factures structurées dans le canal agréé 2026, elles ne s'occupent pas du PDF reçu hors canal. Elles répondent à la question « comment être conforme à la réforme », pas à la question « comment traiter les factures qui n'arrivent pas par la plateforme ». Indispensables pour la conformité, hors sujet pour l'extraction.

Le critère de choix à l'intérieur de la catégorie 2 mérite d'être nommé : le couple « schéma paramétrable + vérification depuis la page source ». Sans schéma paramétrable, le tableur revient à la même contrainte qu'un convertisseur figé et le post-traitement Excel récupère ce qu'on croyait avoir gagné. Sans vérification depuis la page source, le contrôle redevient une relecture intégrale et la promesse d'automatisation s'effondre dès le premier lot sérieux. Avec les deux, le travail mensuel d'extraction s'inscrit dans un rythme tenable, le tableur s'aligne sur l'outil de destination, et la piste d'audit reste lisible jusqu'au document d'origine.

Les champs qui comptent dans une facture fournisseur française

Concevoir le schéma de colonnes selon la destination comptable

Trois destinations typiques structurent trois schémas distincts.

Date facture (AAAA-MM-JJ)
Date échéance
Numéro de facture
Fournisseur (raison sociale)
SIRET
Compte fournisseur 401XXX
Compte de charges suggéré
Libellé écriture
Montant HT
Taux TVA
Montant TVA
Montant TTC
Devise
Référence fichier
Page

Numéro de facture (répété sur chaque ligne)
Fournisseur
Date facture
Description article
Quantité
Prix unitaire HT
Total ligne HT
Taux TVA ligne
Catégorie de dépense
Centre de coût
Référence fichier
Page

Le déroulé concret : importer le lot, décrire les colonnes, exporter

Le geste est court parce qu'il tient en un écran : une zone de dépôt de fichiers et un champ de prompt. Voici comment il se déroule sur un dossier mensuel typique.

Extraire pour chaque facture : Fournisseur, SIRET, Numéro de facture, Date facture (AAAA-MM-JJ), Date échéance, Montant HT, Taux TVA, Montant TVA, Montant TTC, IBAN. Une ligne par facture. Si plusieurs taux de TVA sur la même facture, ventiler en colonnes HT_5_5, TVA_5_5, HT_10, TVA_10, HT_20, TVA_20.

Les scans, les photos, et les mises en page qui varient

Vérifier chaque extraction depuis la page source

La réception électronique 2026 et les factures qu'il faudra encore extraire

Il vaut la peine de cadrer rapidement le sujet, parce qu'il flotte sur toute conversation autour de la facture fournisseur en ce moment, sans pour autant déplacer le problème pratique du jour.

Comparer les catégories d'outils pour ce travail

Quatre familles d'outils s'adressent peu ou prou au même problème, avec des promesses et des limites très différentes. Les situer correctement aide à éviter le mauvais choix.

Extraire des factures PDF vers Excel : guide France

Les champs qui comptent dans une facture fournisseur française

Concevoir le schéma de colonnes selon la destination comptable

Le déroulé concret : importer le lot, décrire les colonnes, exporter

Les scans, les photos, et les mises en page qui varient

Vérifier chaque extraction depuis la page source

La réception électronique 2026 et les factures qu'il faudra encore extraire

Comparer les catégories d'outils pour ce travail

Extract invoice data to Excel with natural language prompts

Extraire les factures fournisseurs de restaurant vers Excel

Rapprochement facture bon de livraison : méthode Excel

Importer des factures fournisseurs dans Acomba avec Excel

Extraire des factures PDF vers Excel : guide France

Les champs qui comptent dans une facture fournisseur française

Concevoir le schéma de colonnes selon la destination comptable

Le déroulé concret : importer le lot, décrire les colonnes, exporter

Les scans, les photos, et les mises en page qui varient

Vérifier chaque extraction depuis la page source

La réception électronique 2026 et les factures qu'il faudra encore extraire

Comparer les catégories d'outils pour ce travail

Extract invoice data to Excel with natural language prompts

Extraire les factures fournisseurs de restaurant vers Excel

Rapprochement facture bon de livraison : méthode Excel

Importer des factures fournisseurs dans Acomba avec Excel