Per chi cerca estrazione massiva fatture elettroniche Excel, il risultato più utile non è un file unico con l'XML "aperto" in celle sparse. Serve almeno un workbook con due tabelle: una riga per fattura e una riga per ogni dettaglio articolo. La tabella per fattura serve per totali, IVA, fornitore, data e tipo documento; quella per righe serve per analisi acquisti, aliquote, DDT, ritenute e controlli di quadratura.
Il motivo è nel formato di partenza. FatturaPA non è un CSV mascherato: secondo la scheda tecnica PA Docs sul formato FatturaPA, è un file XML sviluppato dall'Agenzia delle Entrate che comprende dati anagrafico-fiscali delle parti, metadati della fattura, descrizione fiscale di beni o servizi e allegati codificati nel file. In altre parole, contiene blocchi annidati. Excel lavora bene quando quei blocchi vengono trasformati in tabelle coerenti.
Se lo studio ha scaricato un mese di fatture passive dal cassetto fiscale, dalla PEC o da un intermediario SDI, il primo obiettivo dovrebbe essere questo: per ogni file sorgente, sapere quali dati finiscono nella testata e quali finiscono nelle righe. Una fattura con dieci righe non può essere schiacciata senza criterio in una sola riga Excel, perché descrizioni, quantità, prezzi, aliquote e riferimenti possono ripetersi con significati diversi.
"Convertire fatture XML SDI in Excel" quindi non significa solo rendere il file leggibile. Significa ottenere dati filtrabili, ordinabili e verificabili: un riepilogo per fornitore, una pivot per aliquota IVA, un controllo tra imponibile e totale documento, una base dati che un collaboratore possa usare senza tornare a leggere ogni XML a mano.
Il modello Excel più solido: testata fattura e righe dettaglio separate
Il modello più robusto per trasformare FatturaPA XML in foglio di calcolo è semplice: una tabella per la testata documento e una tabella per le righe. Le due tabelle si collegano con un ID fattura, il nome del file sorgente o un identificativo creato durante l'estrazione. Questa chiave è ciò che permette di passare dal riepilogo al dettaglio senza perdere il legame con il documento originale.
La tabella testata contiene una riga per ogni fattura. In uno studio, di solito servono almeno fornitore, partita IVA, codice fiscale quando presente, data, numero, tipo documento TD, imponibile totale, IVA, totale documento, valuta, scadenza e dati pagamento se il file li contiene. Questa tabella è quella giusta per controlli per periodo, elenco fatture ricevute, riepiloghi per fornitore e quadrature veloci.
La tabella righe contiene una riga per ogni DettaglioLinee. Qui l'ID fattura va ripetuto su ogni riga, insieme a numero linea, descrizione, quantità, prezzo unitario, sconti, imponibile di riga, aliquota, natura IVA e riferimenti a ordine o DDT quando presenti. È la tabella che serve quando il commercialista o l'azienda vuole capire che cosa è stato acquistato, non solo da chi e per quale totale.
Un unico foglio "una riga per fattura" può bastare per una verifica rapida del totale acquisti o per un elenco documenti. Diventa fragile appena una fattura contiene più aliquote, più righe articolo, bollo, ritenuta o riferimenti ripetuti. Un foglio unico molto largo, con colonne tipo Riga1Descrizione, Riga2Descrizione e così via, è comodo da guardare una volta ma scomodo da filtrare, aggregare e mantenere.
Pensare al workbook come a un piccolo modello relazionale evita molte correzioni manuali. La testata risponde a "quali fatture ho ricevuto?"; le righe rispondono a "che cosa c'è dentro quelle fatture?". Excel, Power Query e le pivot lavorano meglio quando queste due domande restano separate.
Campi FatturaPA da estrarre per fatture passive e riepiloghi IVA
Per esportare fatture passive in Excel in modo utile allo studio, conviene leggere il tracciato FatturaPA come una mappa di lavoro. CedentePrestatore alimenta i dati del fornitore: denominazione, partita IVA, codice fiscale, indirizzo e regime quando serve. CessionarioCommittente identifica il cliente o l'azienda che riceve la fattura, utile quando lo stesso lotto contiene documenti di più soggetti.
DatiGeneraliDocumento è il cuore della tabella testata. Da qui arrivano data, numero, tipo documento, divisa, causale e importi di documento. Il codice TD va conservato perché cambia il trattamento operativo del file: una TD01 ordinaria, una TD04, una TD05 o una TD24 non vanno lette allo stesso modo quando si fanno filtri e controlli.
DettaglioLinee è il blocco da cui nasce la tabella righe. Se lo studio vuole estrarre righe dettaglio fattura elettronica XML, deve mantenere descrizione, quantità, prezzo unitario, sconti, aliquota, natura e importo riga in record separati. Appiattire tutto nella testata fa perdere la possibilità di analizzare acquisti per articolo, categoria, commessa o aliquota.
DatiRiepilogo ha un ruolo diverso. Raccoglie imponibile e imposta per aliquota o natura IVA, quindi è prezioso per quadrature e controlli, ma non sostituisce le righe articolo. Una fattura può avere dieci righe al 22 per cento e un solo riepilogo per quella aliquota; se si usa solo DatiRiepilogo, si controlla l'IVA ma non si vede che cosa è stato comprato.
Altri blocchi meritano colonne dedicate quando incidono sul lavoro successivo. DatiPagamento aiuta a ricostruire scadenze e modalità; DatiRitenuta segnala compensi professionali e ritenute; DatiBollo evita di perdere importi piccoli ma rilevanti; la scissione pagamenti cambia la lettura dell'IVA nei controlli AP. Non tutti i clienti useranno tutte queste colonne, ma ignorarle in estrazione costringe a riaprire i file quando servono.
Trappole da gestire prima che Excel rovini i dati
La prima trappola è far decidere a Excel il tipo dei campi. Partita IVA, codice fiscale, codice destinatario, CAP e codici articolo vanno trattati come testo. Se Excel li interpreta come numeri, può eliminare zeri iniziali, trasformare valori lunghi in notazione scientifica o rendere diverso lo stesso codice tra un file e l'altro.
Le note di credito e le note di debito richiedono una regola esplicita. I TD04 e TD05 devono restare riconoscibili in una colonna tipo documento, e gli importi devono seguire una logica coerente: importi negativi per le note di credito, oppure importi positivi con classificazione separata, ma non entrambe le cose nello stesso workbook. La regola scelta deve essere chiara prima di costruire pivot o riepiloghi per fornitore.
Le TD24 meritano attenzione perché la fattura differita può contenere riferimenti a documenti di trasporto. Se il file include numeri e date DDT, conviene conservarli nelle righe o in colonne dedicate; chi deve approfondire può usare la guida sulla gestione delle fatture differite TD24 collegate ai DDT per collegare l'estrazione al flusso documentale.
I codici TD17, TD18 e TD19 appartengono a un lavoro diverso dalle normali fatture passive ricevute dallo SDI. Possono entrare nel perimetro dei controlli su acquisti esteri, ma non vanno confusi con il batch ordinario di fatture ricevute. Per quel flusso, la lettura corretta passa dalla autofattura TD17, TD18 e TD19 per fornitori esteri, non da una semplice conversione XML in Excel.
Ritenuta d'acconto, bollo, split payment e arrotondamenti sono campi piccoli solo in apparenza. Se non vengono estratti, un riepilogo può sembrare in quadratura sui totali ma fallire appena si controllano imponibile, IVA, netto da pagare o debito verso il fornitore. Lo stesso vale per fatture con più aliquote: il totale documento può essere corretto, mentre la ripartizione per aliquota è incompleta.
Gli allegati codificati nel file XML sono un caso a parte. Vanno conservati come informazione di presenza o riferimento se servono per supporto documentale, ma non sempre diventano dati tabellari. L'estrazione deve distinguere tra ciò che serve al controllo contabile e ciò che va solo mantenuto come prova o materiale a corredo.
Power Query, export, utility desktop o servizio hosted: quale metodo scegliere
Power Query è una buona scelta quando in studio c'è qualcuno che sa mantenere query e trasformazioni. Può importare file da una cartella, espandere nodi XML e costruire tabelle aggiornabili. Il limite emerge quando cambiano clienti, tracciati, campi opzionali o file P7M: una query che funziona su un lotto pulito può richiedere correzioni appena incontra righe mancanti, blocchi ripetuti o dati interpretati con il tipo sbagliato. Per ricerche come fatture elettroniche XML Power Query, la domanda vera non è se Excel possa importare XML, ma chi manterrà la trasformazione nel tempo.
L'export dal gestionale, dal portale di fatturazione o dall'intermediario SDI è spesso il percorso più rapido se tutte le fatture sono già dentro quella piattaforma. Va verificato però il livello di dettaglio. Alcuni export danno un elenco documenti con totali; altri includono righe articolo, aliquote, riferimenti e campi utili per controlli IVA. Se il file non contiene le righe o non conserva gli identificativi del documento sorgente, lo studio finisce comunque a integrare dati a mano.
Le utility desktop e i convertitori XML sono adatti a lavori ricorrenti e circoscritti: cartella di file, conversione in griglia, export in Excel o CSV. Il compromesso è operativo. Possono dipendere da Windows, installazioni locali, aggiornamenti del tracciato e configurazioni per singola macchina. Per uno studio piccolo può essere sufficiente; per un team che lavora su molti clienti, la manutenzione diventa parte del costo reale.
Se il lotto è composto solo da XML/P7M FatturaPA, il percorso più lineare resta XML-aware: Power Query ben mantenuto, un parser dedicato o una utility che esporti sia testate sia righe. Il criterio da usare non è la quantità di file convertiti, ma la fedeltà del modello Excel: chiavi di collegamento, DatiRiepilogo separati dalle righe, codici conservati come testo e regole esplicite per TD04, TD05, TD24 e flussi esteri.
I servizi hosted prompt-based hanno senso quando il lavoro non è solo "leggere XML", ma produrre un output strutturato da documenti eterogenei con istruzioni esplicite su colonne, formati e righe. Invoice Data Extraction, ad esempio, permette di caricare documenti supportati come PDF e immagini, descrivere in linguaggio naturale quali dati estrarre e scaricare Excel, CSV o JSON; può gestire batch fino a 6.000 file e salvare prompt ricorrenti. Questo lo rende rilevante per flussi di estrazione dati da fatture in Excel dove arrivano anche PDF, scansioni, immagini o documenti non normalizzati, mentre un batch di soli XML FatturaPA resta un caso in cui un parser XML o Power Query possono essere più diretti.
La scelta corretta dipende dal file finale che serve allo studio. Se basta un elenco totali, l'export della piattaforma può chiudere il problema. Se servono righe articolo, campi IVA, riferimenti DDT e regole coerenti sui codici, bisogna valutare lo sforzo di configurazione e controllo, non solo il pulsante "esporta".
Come impostare un batch ricorrente per clienti diversi
Uno studio dovrebbe trattare ogni estrazione come un processo ripetibile, non come una conversione occasionale. La cartella di lavoro va preparata separando clienti, periodi e fonti: un lotto per cliente, una finestra temporale chiara, file sorgenti conservati con nomi stabili. Se arrivano XML, P7M e allegati, conviene distinguere ciò che deve entrare nel dataset da ciò che va solo archiviato.
Lo schema colonne dovrebbe essere deciso prima del primo import. Per la testata: nome fornitore, partita IVA, codice fiscale, data documento, numero, tipo TD, imponibile, IVA, totale, valuta, scadenza e metodo di pagamento se presenti. Per le righe: descrizione, quantità, prezzo unitario, imponibile riga, aliquota, natura IVA, riferimenti DDT, ritenuta, bollo e una nota di estrazione quando il campo richiede interpretazione.
Quando si usa uno strumento basato su istruzioni o prompt, le regole devono essere scritte come regole contabili, non come frasi generiche. Esempi naturali sono: estrai una riga per fattura con data, fornitore, imponibile, IVA e totale; oppure crea una riga per ogni articolo e ripeti numero fattura, data e fornitore su ogni riga. Per i codici, l'istruzione deve dire di conservarli come testo; per date e importi, deve indicare formati coerenti con Excel.
Invoice Data Extraction usa proprio questo modello per i documenti supportati: l'utente carica i file, descrive i campi da estrarre in un prompt, può salvare prompt ricorrenti nella propria libreria e scarica un file strutturato in Excel, CSV o JSON. In uno studio multi-cliente, la parte più utile non è il prompt scritto una volta, ma la possibilità di riusare e adattare istruzioni per clienti diversi senza ricostruire da zero lo schema di output.
Ogni riga dovrebbe conservare almeno un riferimento al file sorgente. Quando lo strumento lo rende disponibile, anche il numero pagina o un riferimento equivalente aiuta il controllo a campione. La tracciabilità è ciò che rende correggibile un workbook: se una pivot mostra un totale anomalo, il collaboratore deve poter tornare al documento originale senza cercarlo manualmente tra centinaia di file.
Controlli finali sul riepilogo prima di usarlo per pivot o liquidazione
Il riepilogo fatturato da fatture elettroniche diventa utile quando regge i controlli di base. Prima di usarlo per pivot, liquidazione IVA o passaggio a un gestionale, lo studio dovrebbe confrontare il numero di file importati con i file sorgenti, verificare che ogni documento abbia data, numero e fornitore, e controllare che imponibile, IVA e totale della tabella testata tornino con i dati del documento.
Il controllo più importante è per aliquota. La somma di imponibile e imposta nelle righe deve essere confrontabile con DatiRiepilogo, soprattutto quando una fattura contiene più aliquote o nature IVA. Se il totale documento torna ma la ripartizione per aliquota non torna, la pivot per liquidazione o analisi acquisti rischia di essere fuorviante.
Vanno cercate anche anomalie tipiche: partite IVA mancanti o troppo corte, codici fiscali trasformati, date vuote, importi riga non numerici, fatture senza tipo documento, note di credito con segno incoerente, righe senza ID fattura. Questi errori non sempre bloccano l'Excel, ma emergono appena si filtra per mese, fornitore o aliquota.
Il file estratto non sostituisce il controllo contabile. È la base dati che rende più veloce decidere che cosa controllare: documenti sopra soglia, fornitori nuovi, TD particolari, righe con natura IVA, split payment, ritenute o bollo. Dopo l'estrazione, il passo naturale è applicare controlli su una fattura elettronica ricevuta dopo lo SDI sui casi che il workbook evidenzia.
Un'estrazione ha fatto il suo lavoro quando il workbook sostiene filtri, pivot, quadrature e controllo a campione senza costringere lo studio a correggere riga per riga. Se per ogni anomalia esiste un riferimento al file sorgente e una colonna che spiega da dove arriva il dato, il foglio non è solo un export: è una base di lavoro verificabile.
Extract invoice data to Excel with natural language prompts
Upload your invoices, describe what you need in plain language, and download clean, structured spreadsheets. No templates, no complex configuration.
Related Articles
Explore adjacent guides and reference articles on this topic.
Autofattura TD17, TD18, TD19 per fornitori esteri
Guida pratica a TD17, TD18 e TD19 per fatture di fornitori esteri. Spiega quale codice usare, come compilare l'XML e quando inviare allo SDI.
Controlli fattura elettronica ricevuta oltre SDI
Checklist AP per controllare una fattura ricevuta dopo lo SDI. Include anagrafica fornitore, IVA, bollo, match con ordine/DDT e autorizzazione al pagamento.
Come estrarre dati da buste paga PDF in Excel
Guida pratica per estrarre dati da buste paga PDF in Excel: campi del cedolino, struttura colonne, OCR, controlli e limiti del calcolo payroll.