ZUGFeRD in Excel importieren: XML richtig auslesen

So lesen AP-Teams ZUGFeRD-XML aus und importieren Rechnungsnummern, Lieferanten, USt.-Sätze, Summen und Positionen sauber nach Excel.

Published
Updated
Reading Time
9 min
Topics:
Tax & ComplianceGermanyZUGFeRDE-RechnungExcelXML invoicing

Eine ZUGFeRD-Rechnung lässt sich nach Excel übertragen, indem zuerst die eingebettete XML-Datei aus dem PDF/A-3 ausgelesen und anschließend in Excel, Power Query oder einem Extraktionstool in Spalten wie Rechnungsnummer, Lieferant, Beträge, USt.-Sätze und Positionen umgewandelt wird. Wer ZUGFeRD in Excel importieren will, sollte also nicht mit OCR auf der sichtbaren PDF-Seite beginnen, sondern mit den strukturierten Rechnungsdaten, die im PDF mitgeliefert werden.

Für einzelne Dateien reicht oft ein manueller Weg: PDF-Anhang öffnen, XML-Datei speichern, in Excel oder Power Query laden und die benötigten Felder auf Tabellen bringen. Für laufende Rechnungseingänge ist dieser Ablauf meist zu brüchig. Dann muss ein Batch-Workflow dieselben Spalten über viele Lieferanten, Profile und Dokumenttypen hinweg konsistent erzeugen.

Der wichtige Punkt für AP-Teams ist die Rollenverteilung in der Datei. Das PDF ist die visuelle Rechnung, die Menschen lesen, prüfen und im Zweifel mit dem Lieferanten besprechen. Die XML ist die strukturierte Datenquelle für den Import. Wenn beide vorhanden und plausibel sind, sollte Excel die XML auslesen, weil Rechnungsnummer, Datum, Beträge, Steuerinformationen, Zahlungsbedingungen und, je nach Profil, Positionen dort maschinenlesbar stehen.

Damit ist der Excel-Export nicht nur eine technische Konvertierung. Er ist ein Kontrollformat für Rechnungseingang, Buchungsvorbereitung und Abstimmung. Eine brauchbare Tabelle muss deshalb mehr leisten als "XML geöffnet": Sie muss die Felder so abbilden, dass Summen geprüft, USt.-Sätze nachvollzogen, Lieferanten eindeutig erkannt und Positionen bei Bedarf weiterverarbeitet werden können.

Welche Datei Excel wirklich lesen sollte

Eine ZUGFeRD-Datei sieht im Alltag wie eine normale PDF-Rechnung aus. Technisch ist sie aber ein PDF/A-3-Dokument mit einer eingebetteten XML-Datei. Nach der FeRD-Erklärung zur inhaltlichen Identität von ZUGFeRD integriert ZUGFeRD strukturierte Rechnungsdaten im XML-Format in einem PDF/A-3-Dokument: Das PDF ist die Sichtkomponente, die XML-Daten ermöglichen die elektronische Verarbeitung.

In aktuellen Dateien heißt der XML-Anhang typischerweise factur-x.xml. Ältere ZUGFeRD-Versionen können andere Dateinamen verwenden, etwa ZUGFeRD-invoice.xml. Für den Excel-Import ist nicht der Name entscheidend, sondern dass die eingebettete Datei die Rechnungsdaten strukturiert enthält.

Excel sollte diese XML-Daten lesen, wenn sie vorhanden und vertrauenswürdig sind. OCR der sichtbaren PDF-Seite ist die schlechtere Ausgangsbasis, weil sie aus Layout wieder Daten erraten muss. Die XML enthält die Felder bereits als strukturierte Werte: Rechnungsnummer, Datum, Beträge, Steuerinformationen, Zahlungsbedingungen und, je nach Profil, Positionen.

Factur-X ist in diesem Zusammenhang kein anderer Workflow, sondern die französisch-deutsche Bezeichnung derselben hybriden PDF-XML-Familie. Wer die Begriffe sauber trennen möchte, findet den Hintergrund in Factur-X und ZUGFeRD als hybrides PDF-XML-Format. Für den Excel-Prozess bleibt die praktische Frage gleich: Gibt es eine eingebettete XML, und enthält sie die Daten, die der Rechnungsempfänger prüfen oder weiterverarbeiten muss?

Wenn PDF-Ansicht und XML voneinander abweichen, sollte ein AP-Team nicht frei entscheiden, welche Version "besser" aussieht. Dann liegt ein Lieferanten- oder Prozessproblem vor. Die Rechnung muss fachlich geklärt werden, bevor die Daten in Excel für Freigabe, Buchung oder Zahlung verwendet werden.

Die Excel-Struktur muss zur Rechnungsprüfung passen

Eine gute Excel-Ausgabe bildet nicht einfach den XML-Baum nach. Sie übersetzt die ZUGFeRD-Daten in ein Tabellenmodell, mit dem Buchhaltung und Controlling wirklich arbeiten können. Für den Rechnungskopf gehören mindestens diese Felder in die Haupttabelle: Rechnungsnummer, Rechnungsdatum, Lieferant, USt-IdNr. oder Steuernummer, Währung, Netto-, Steuer- und Bruttobetrag sowie Fälligkeitsdatum oder Zahlungsbedingungen.

Bei Positionen braucht Excel eine andere Detailtiefe. Eine brauchbare Zeilentabelle enthält Beschreibung, Menge, Einheit, Einzelpreis, Nettozeilenbetrag, USt.-Satz, Steuerbetrag und je nach Arbeitsweise Brutto- oder Gesamtbetrag der Position. Diese Struktur macht sichtbar, ob die Summe der Positionen zur Kopfsumme passt und ob die steuerliche Behandlung je Position nachvollziehbar bleibt.

Mehrere USt.-Sätze sind der Punkt, an dem viele einfache Exporte unübersichtlich werden. Eine Rechnung kann zum Beispiel Positionen mit Regelsteuersatz, ermäßigtem Satz und steuerfreien Beträgen enthalten. Wenn all das in eine einzige Steuer- oder Summenspalte gedrückt wird, verliert das AP-Team die Prüfbarkeit.

Praktischer ist eines von zwei Modellen. Entweder erhält die Excel-Datei ein separates Blatt für die USt.-Aufschlüsselung, in dem Bemessungsgrundlage, Steuersatz und Steuerbetrag je Kategorie stehen. Oder die Positionsdaten werden gestapelt geführt, sodass jede Steuerkategorie als eigener Datensatz prüfbar bleibt. Welche Variante besser ist, hängt davon ab, ob Excel vor allem zur Sichtprüfung, zum Import in ein Buchhaltungssystem oder zur Abstimmung mehrerer Lieferantenrechnungen dient.

Für AP-Zwecke ist die Zielstruktur wichtiger als der technische Importweg. Eine Tabelle, die Rechnungsnummern und Gesamtsummen sauber erfasst, aber keine Positionen, keine Steuerlogik und keine Lieferantenkennung trägt, reicht vielleicht für ein Register. Für Kontierung, Bestellabgleich oder USt.-Prüfung ist sie zu dünn.

Für EN-16931-nahe Daten lohnt sich eine bewusste Zuordnung der BT- und BG-Elemente zu Excel-Spalten. Die Namen müssen nicht technisch bleiben, aber die fachliche Herkunft sollte erkennbar sein:

  • BT-1 wird zur Spalte Rechnungsnummer für Dublettenprüfung und Buchungsreferenz.
  • BT-2 wird zur Spalte Rechnungsdatum für Fristen, Periodenabgrenzung und Zahlungsziel.
  • BT-3 wird zur Spalte Rechnungstyp, damit Rechnung, Gutschrift und Korrektur nicht vermischt werden.
  • BT-5 wird zur Spalte Währung, besonders wichtig bei Fremdwährungen.
  • BT-9 wird zur Spalte Fälligkeitsdatum für Zahlungsplanung und Skontoprüfung.
  • BT-13 wird zur Spalte Bestellreferenz für den Abgleich gegen Bestellung oder Wareneingang.
  • BT-27 wird zur Spalte Lieferantenname für den Stammdatenabgleich.
  • BT-31 wird zur Spalte USt-IdNr. des Lieferanten für die steuerliche Prüfung.
  • BG-22 wird zum Summenbereich für Netto-, Steuer- und Bruttobeträge.
  • BG-23 wird zur USt.-Aufschlüsselung für Rechnungen mit mehreren Steuersätzen.
  • BG-25 wird zur Positionstabelle für Zeilenprüfung, Kontierung und Bestellabgleich.

Drei Wege vom ZUGFeRD-PDF zur Excel-Datei

Der manuelle Weg ist sinnvoll, wenn es um einzelne Dateien oder eine erste Analyse geht. Der Ablauf ist überschaubar: PDF-Anhänge öffnen, die Datei factur-x.xml oder den entsprechenden XML-Anhang speichern, in Excel über Daten, Daten abrufen, Aus Datei, Aus XML laden und die relevanten Knoten auswählen. Danach werden verschachtelte Werte aufgeklappt, Feldnamen fachlich bereinigt und die Werte auf die Spalten verteilt, die der Rechnungseingang braucht.

Power Query ist dafür nützlich, weil die Transformationen wiederholbar sind. Bei gleich aufgebauten Lieferantenrechnungen kann ein einmal erstellter Ablauf wiederverwendet werden. Die Grenze zeigt sich, sobald die Dateien aus verschiedenen Quellen kommen, unterschiedliche Profile haben oder einzelne Lieferanten ihre XML-Struktur anders befüllen. Dann wird aus einem scheinbar einfachen Import eine Sammlung von Sonderfällen.

Viewer und Converter passen eher zur gelegentlichen Einzelprüfung. Sie helfen, den XML-Inhalt sichtbar zu machen, eine Datei zu testen oder eine Rechnung schnell in ein Tabellenformat zu bringen. Bei Online-Convertern kommt ein zusätzlicher Prüfpunkt dazu: Rechnungsdaten werden hochgeladen, also müssen Datenschutz, Vertraulichkeit und Freigabe durch das Unternehmen vorher klar sein. Für einen dauerhaften AP-Prozess sind solche Tools nur dann ausreichend, wenn das Volumen klein bleibt und niemand eine konsistente Ausgabestruktur über viele Lieferanten hinweg erwartet.

Bei laufendem Rechnungseingang zählt der Batch-Workflow. Dann sollen viele ZUGFeRD-PDFs und weitere Rechnungsdokumente in dieselbe XLSX- oder CSV-Struktur laufen, damit AP nicht je Lieferant neu entscheidet, welche Spalte welche Bedeutung hat. An diesem Punkt wird Rechnungsdaten automatisch nach Excel extrahieren relevant: Invoice Data Extraction verarbeitet Rechnungen und Finanzdokumente zu strukturierten Excel-, CSV- oder JSON-Dateien. Nutzer laden Dateien hoch, beschreiben im Prompt, welche Felder und welches Ausgabeformat sie brauchen, und laden die strukturierten Daten herunter.

Der Unterschied ist nicht nur Bequemlichkeit. Ein manueller Import prüft eine Datei. Ein Batch-Workflow stabilisiert den Prozess: gleiche Spalten, gleiche Feldlogik, weniger Copy-and-paste zwischen XML, PDF-Ansicht und Arbeitsmappe.

Warum Positionen manchmal fehlen

Wenn nach dem Import nur Kopfdaten in Excel stehen, ist nicht automatisch Excel schuld. Häufig liegt die Ursache im ZUGFeRD-Profil oder in den gelieferten XML-Inhalten. Niedrige Profile wie MINIMUM und BASIC WL können auf Headerdaten beschränkt sein. Dann gibt es keine Positionsdetails, die ein Importweg sauber in eine Zeilentabelle schreiben könnte.

BASIC enthält mehr Struktur und kann Positionen liefern, erreicht aber nicht dieselbe Tiefe wie EN 16931, häufig auch COMFORT genannt, EXTENDED oder XRECHNUNG-nahe Daten. Für den Rechnungsempfänger ist diese Unterscheidung praktisch: Je detaillierter und normnäher die XML ist, desto besser lassen sich Positionen, Steuersätze, Bestellbezüge und Summen in Excel prüfen.

Die erste Diagnose sollte deshalb nicht lauten: "Der Export ist kaputt." Besser ist: Welches Profil hat die Datei, und welche Daten stehen tatsächlich in der XML? Wenn dort nur Rechnungsnummer, Datum, Lieferant und Gesamtbeträge vorhanden sind, kann Excel keine vollständigen Positionsdaten erzeugen. Wer die Profilunterschiede genauer nachvollziehen muss, findet die Einordnung im Artikel ZUGFeRD-Profile und Formatgrundlagen.

Für AP-Prozesse ist das mehr als ein technisches Detail. Kopfdatenerfassung kann für Eingangsregister, Fristenkontrolle oder einfache Freigaben reichen. Positionsdaten werden wichtig, sobald Kostenstellen, Bestellungen, Warengruppen, Mengen oder USt.-Sätze je Zeile geprüft werden. Wenn diese Details fehlen, sollte der Lieferant ein geeigneteres Profil oder vollständigere XML-Daten liefern, statt dass das AP-Team die Lücke manuell aus der PDF-Ansicht nachträgt.

Prüfen, bevor die Excel-Datei weiterverarbeitet wird

Eine aus ZUGFeRD erzeugte Excel-Datei sollte vor der Weiterverarbeitung dieselben Grundprüfungen bestehen wie jede andere Eingangsrechnung. Rechnungsnummer und Rechnungsdatum müssen zur PDF-Ansicht passen. Lieferant, Adresse, USt-IdNr. oder Steuernummer müssen eindeutig sein. Die Währung darf nicht stillschweigend verloren gehen, besonders bei internationalen Lieferanten.

Die Betragslogik ist der nächste Prüfpunkt: Netto plus Steuer muss Brutto ergeben, die Summe der Positionen muss zur Kopfsumme passen, und die USt.-Sätze müssen zur Steueraufschlüsselung passen. Bei mehreren Steuersätzen sollte Excel nicht nur einen Gesamtsteuerbetrag zeigen, sondern die Bemessungsgrundlage und den Steuerbetrag je Satz nachvollziehbar machen.

Wenn die sichtbare PDF-Rechnung und die XML unterschiedliche Werte tragen, ist das kein normaler Excel-Fall. Die Differenz gehört in die Lieferantenklärung oder in die interne Prozessprüfung. Ein Import sollte nicht stillschweigend den einen Wert aus der PDF-Ansicht und den anderen aus der XML übernehmen, nur weil dadurch eine Tabelle vollständiger wirkt.

Die deutsche E-Rechnungspflicht für Rechnungsempfänger macht strukturierte Rechnungsdaten im B2B-Umfeld wichtiger, ersetzt aber nicht die fachliche Prüfung. Excel bleibt in vielen Teams ein Zwischen- und Kontrollformat: nützlich für Sichtprüfung, Abstimmung, Ausnahmen und vorbereitende Buchungslogik, aber kein Ersatz für Freigabe, Stammdatenkontrolle oder eine saubere Archivierungsentscheidung.

Der passende Workflow hängt vom Rechnungseingang ab

Für eine einzelne ZUGFeRD-Datei ist Power Query oder ein manueller XML-Import oft der schnellste Weg. Für eine kurze Sichtprüfung reicht ein Viewer oder Converter. Für wiederkehrende Rechnungseingänge mit mehreren Lieferanten ist eine Batch-Extraktion stabiler, weil sie nicht jedes Dokument als neues Einzelprojekt behandelt.

In der Praxis bleibt ZUGFeRD selten allein. Ein Rechnungseingang kann ZUGFeRD-PDFs, Factur-X-Dateien, XRechnung-XML, normale PDF-Rechnungen, Scans und Bilddateien enthalten. Das Ziel ist trotzdem meist dasselbe: eine konsistente Excel- oder CSV-Struktur, in der Rechnungsnummern, Lieferanten, Beträge, Steuerlogik und Positionen über alle Eingänge hinweg vergleichbar sind.

Für den PDF- und Scan-Anteil solcher gemischten Eingänge passt Invoice Data Extraction, wenn ein Team nicht für jeden Lieferanten eine eigene Importlogik pflegen will. Die Plattform wandelt Rechnungen und Finanzdokumente in strukturierte Excel-, CSV- oder JSON-Dateien um; Nutzer laden Dokumente hoch, beschreiben die gewünschten Felder in einem Prompt und laden die Ausgabe herunter. Für reine Einzeldateien ist das nicht zwingend nötig. Für gemischte Dokumentenstapel und wiederholbare AP-Ausgaben kann genau diese einheitliche Struktur den Unterschied machen.

Die Entscheidung ist damit einfach fachlich: manuell importieren, wenn nur eine Datei geprüft werden soll; Viewer nutzen, wenn ein Inhalt schnell sichtbar werden muss; automatisieren, wenn der Rechnungseingang regelmäßig, gemischt oder prüfungsintensiv ist.

Extract invoice data to Excel with natural language prompts

Upload your invoices, describe what you need in plain language, and download clean, structured spreadsheets. No templates, no complex configuration.

Exceptional accuracy on financial documents
1–8 seconds per page with parallel processing
50 free pages every month — no subscription
Any document layout, language, or scan quality
Native Excel types — numbers, dates, currencies
Files encrypted and auto-deleted within 24 hours
Continue Reading