Connect with us

Vordenker

Warum die Automatisierung von Enterprise-AP mehr als ein Sprachmodell benötigt

mm

78 % der KI-Tools sind Wrappers. Hier ist, was die anderen 22 % gebaut haben.

Der Markt für die Automatisierung von Accounts Payable ist mit neuen Anbietern überflutet. Öffnen Sie Product Hunt an einem beliebigen Tag und Sie finden Dutzende von Tools, die behaupten, “Rechnungsverarbeitung mit KI zu automatisieren“. Die Mehrheit dieser Tools teilt eine gemeinsame Architektur: Eine Benutzeroberfläche, die um eine LLM-API gewickelt ist, einige Prompt-Engineering und nicht viel mehr.

Für bestimmte Anwendungsfälle funktioniert dieser Ansatz gut, aber die Automatisierung von Enterprise-AP erfordert eine wesentlich anspruchsvollere Daten-Technologie.

Gartners Marktführer für Intelligent Document Processing weist darauf hin, dass der IDP-Markt “dicht mit Anbietern besetzt ist”, da “kommodifizierte natürliche Sprachtechnologie die Markteintrittsbarriere gesenkt hat”. Forresters Forschung aus dem Jahr 2025 fand heraus, dass generative KI “zum Equalizer wird, der die Fähigkeit der Anbieter, sich zu differenzieren, in Frage stellt”.

Diese Verbreitung von Optionen ist tatsächlich gute Nachricht für Käufer, da sie den Wettbewerb antreibt und die Preise verbessert. Die Herausforderung besteht darin, zu wissen, welches Tool für welche Aufgabe geeignet ist.

Für die Kontenabwicklung im Besonderen sind die Einsätze anders als bei anderen KI-Anwendungsfällen. Sie erstellen nicht Marketing-Texte oder fassen Besprechungsnotizen zusammen. Sie verarbeiten Finanzdaten, die direkt in ERP-Systeme, Lieferantenzahlungen und Prüfspuren einfließen. Der Spielraum für Fehler ist gering, wenn die Ausgabe oft eine Überweisung ist.

Die wahre Lücke in der AP von heute

Laut Gartner war die Automatisierung von AP für drei Jahre in Folge die wichtigste Digitalisierungspriorität der Finanzvorstände. Doch PwC fand heraus, dass 88 % der Finanzvorstände Schwierigkeiten haben, Wert aus ihren Technologieinvestitionen zu schöpfen.

Warum die Diskrepanz?

Deloittes Umfrage 2023 zum globalen Shared Services und Outsourcing weist auf Prozesskomplexität, technische Integrationsherausforderungen und isolierte Initiativen hin. Währenddessen verbringen 52 % der AP-Teams mehr als 10 Stunden pro Woche mit der Rechnungsverarbeitung und 60 % geben Rechnungsdaten manuell in ihre Buchhaltungssoftware ein.

Die Chance ist hier erheblich. Mit der richtigen Automatisierung können Teams Tausende von Stunden pro Jahr zurückgewinnen, aber die “richtige” Automatisierung hängt vollständig von Ihrem Betriebsumfang und dessen Komplexität ab.

Wo dünne Wrappers funktionieren

Ein dünner Wrapper ist eine minimale Code-Schicht zwischen einer LLM-API und dem Endbenutzer. Der Mehrwert liegt in der Oberfläche, einigen vorgefertigten Prompts und dem Zugriff auf das zugrunde liegende Modell.

Es gibt Szenarien und Anwendungsfälle, in denen diese LLM-Wrappers sehr gut funktionieren; jedoch kämpfen sie, sobald sie auf eine leichte Komplexität stoßen.

Dünne Wrappers funktionieren gut, wenn:

  • Sie niedrige Volumina verarbeiten (weniger als 100 Rechnungen pro Monat)
  • Ihre Lieferanten konsistente, einfache und standardisierte Formate verwenden
  • Sie keine tiefe ERP-Integration benötigen
  • Eine manuelle Überprüfung jeder Ausgabe möglich ist

Dünne Wrappers kämpfen, wenn:

  • Sie Zahlen mit hoher Präzision extrahieren müssen (LLMs interpretieren numerische Daten häufig falsch, auch mit verfeinerten Prompts)
  • Das Volumen konsistente Durchsatz und vorhersehbare Kosten erfordert
  • Sie Echtzeit-Prüfspuren, Vertrauenswerte und Ausnahmehandhabung benötigen
  • Die Integration mit ERP-Systemen bidirektional und in Echtzeit sein muss

Der Unterschied liegt nicht darin, “gut” versus “schlecht” zu sein, sondern vielmehr darin, das Tool mit der Aufgabe zu verbinden. Ein Startup, das 50 Rechnungen pro Monat verarbeitet, hat grundlegend andere Bedürfnisse als ein Hersteller, der 50.000 Rechnungen verarbeitet.

Was die tatsächliche AP erfordert

Die AP erfordert mehr als nur die Rechnungsscanning. Es handelt sich um einen komplexen Workflow, der mehrere Systeme, Validierungsregeln, Genehmigungshierarchien und Compliance-Anforderungen umfasst. Wenn die Rechnungsvolumina steigen und die Compliance-Anforderungen verschärfen, benötigt die AP-Automatisierung vier Fähigkeiten, die über das hinausgehen, was Sprachmodelle standardmäßig bieten.

Mehrfachformat-Dokumentenverarbeitung

LLMs können PDFs und gängige Bildformate wie PNG oder JPG verarbeiten, aber die Unternehmens-AP hat es mit viel mehr zu tun. Rechnungen kommen als EDI-Übertragungen (X12, EDIFACT), XML-Dateien (E-Rechnungen), PRN-Druckströme und TIFF-Bildern von Legacy-Scannern. Ein System, das nur das unterstützt, was ein LLM nativ lesen kann, verpasst einen erheblichen Teil des Dokumentenflusses.

Die Dokumentenlänge und die Zeichenanzahl auf jeder Seite sind ein weiterer Faktor. LLMs sind durch Kontextfenster eingeschränkt, was bedeutet, dass große Rechnungen mit Hunderten von Zeilen oder mehrseitige Verträge das verarbeiten können, was das Modell in einem einzigen Durchgang verarbeiten kann. Die AP-Automatisierung in Unternehmen benötigt Parsing-Logik, die durch Dokumente jeder Größe ohne Beschneidung oder Verlust von Details arbeiten kann.

Tiefe ERP-Integration

ERP-Systeme verwalten Buchhaltung und Lagerverwaltung gut, aber sie sind nicht für unstrukturierte AP-Aufgaben wie die Rechnungsverarbeitung konzipiert. Der typische Workaround umfasst manuelle Prozesse, die Daten zurück in das ERP-System einfließen lassen, was langsam und fehleranfällig ist.

Eine sinnvolle AP-Automatisierung erfordert eine bidirektionale Synchronisierung mit Systemen wie SAP, NetSuite und QuickBooks, die über eine einfache CSV-Exportierung oder einen Webhook hinausgeht, der ins Leere feuert. Sie benötigt eine Integration, die die Datenintegrität über Plattformen hinweg aufrechterhält und Änderungen in Echtzeit widerspiegelt.

ERP-Systeme sind nicht die einzigen Systeme, die wichtig sind. Unternehmen verlassen sich auch auf Legacy-Systeme, Datenbanken, Dateiübertragungsprotokolle wie SFTP und AS2 sowie benutzerdefinierte Anwendungen, die seit Jahrzehnten laufen. Eine echte AP-Automatisierung muss mit all diesen Systemen verbinden, nicht nur mit den modernen cloudbasierten Tools.

Für Organisationen mit mehreren ERP-Systemen, Legacy-Systemen oder Hybrid-Cloud-Umgebungen wird dies zu einem Integrationsproblem. Es erfordert eine speziell entwickelte Middleware oder eine Integrations Ebene, die Datenflüsse über verschiedene Systeme hinweg orchestrieren kann.

Dreifache Abstimmung und Validierung

Die Kernherausforderung der AP besteht in der Verifizierung, einschließlich der Bestätigung, dass Bestellungen, Lieferscheine und Rechnungen vor der Freigabe der Zahlung übereinstimmen. Diese dreifache Abstimmung verhindert Überzahlungen und erkennt Betrug.

Automatisierte Abstimmung erfordert das Verständnis der Dokumentenstruktur, das Extrahieren der richtigen Felder, die Normalisierung von Daten in verschiedenen Formaten und die Anwendung von Geschäftsregeln, um Ausnahmen zu markieren. Das System muss wissen, welche Abweichungen eine manuelle Überprüfung erfordern und welche schnell verarbeitet werden können.

Hier kommt die Branchenkompetenz ins Spiel. Ein System, das für die AP entwickelt wurde, kennt Ihre Lieferantenstammdaten, versteht die Toleranzschwellen und kann Ausnahmen an den richtigen Genehmiger basierend auf Betrag, Abteilung oder Kontonummer weiterleiten.

Workflown-Orchestrierung

Mittelständische und große Unternehmen haben Genehmigungsflüsse, die je nach Abteilung, Rechnungstyp, Einrichtung, Region und Lieferant variieren. Die Genehmigungsflüsse für die Marketing-Ausgaben unterscheiden sich von denen für Kapitaleinkäufe.

Viele AP-Automatisierungsplattformen verfügen nicht über die notwendige Flexibilität für diese Workflows. Sie zwingen Unternehmen, innerhalb der Systembeschränkungen zu arbeiten oder auf manuelle Genehmigungen zurückzugreifen. Dies untergräbt den Zweck der Automatisierung.

Eine echte Workflown-Orchestrierung bedeutet konfigurierbare Regeln, die der tatsächlichen Geschäftsabläufe entsprechen, nicht dem, was ein Softwareanbieter denkt, wie Unternehmen funktionieren sollten.

Echtzeit-Analytics und Sichtbarkeit

Das Wissen, was in Ihrem AP-Pipeline passiert, erfordert mehr als nur die Protokollierung von Ereignissen. Es erfordert ein strukturiertes Datenmodell im Hintergrund, das Anfragen in Millisekunden beantworten kann.

Wie viele Rechnungen warten auf Genehmigung?

Was ist die durchschnittliche Verarbeitungszeit diese Woche?

Welche Lieferanten haben die meisten Ausnahmen?

Diese Fragen benötigen sofortige Antworten, nicht Berichte, die Stunden benötigen, um generiert zu werden. Echtzeit-Dashboards und handhabbare Erkenntnisse sind nur möglich, wenn eine ordnungsgemäße Daten Ebene unter dem Workflow liegt, Informationen für eine schnelle Abrufbarkeit indexiert und organisiert.

Compliance und Prüfspuren

Finanzprozesse erfordern vollständige Rückverfolgbarkeit. Jede Rechnung, Genehmigung, Bearbeitung und Zahlung muss mit Zeitstempeln und Benutzerzuweisung protokolliert werden, da dies von den Vorschriften oft erfordert wird.

Unternehmenssicherheit fügt eine weitere Ebene durch rollenbasierte Zugriffssteuerungen, verschlüsselte Speicherung und Übertragung, Datenhoheitsoptionen und die Möglichkeit, vor Ort zu bereitstellen, wenn dies von den regulatorischen Anforderungen gefordert wird.

Der hybride Ansatz, der funktioniert

Die aufkommende Übereinstimmung unter Praktikern, die Produktionsdokumentensysteme aufbauen, ist, dass effektive Dokumentenverarbeitung mehrere Ansätze kombiniert.

OCR für Erkennung: Bestimmte Zeichenerkennung mit Layoutanalyse erledigt die mechanische Arbeit des Umwandeln von Bildern in Text. Es ist schnell, vorhersehbar und produziert konsistente Ausgaben. Mit der Vor- und Nachbearbeitung von Bildern verbessert sich die Leistung erheblich bei schlechten Scans.

LLMs für Argumentation: Sprachmodelle zeichnen sich durch die Fähigkeit aus, Kontext zu interpretieren, Mehrdeutigkeiten zu handhaben und Urteile über die Dokumentenstruktur zu fällen. LLMs erfassen die räumlichen und semantischen Beziehungen zwischen Feldern und Werten auf einer Rechnung, was dazu beiträgt, ein Verständnis des Dokuments zu entwickeln.

Regeln für Validierung: Geschäftslogik stellt sicher, dass die Ausgabe Ihren Anforderungen entspricht, bevor sie in das Downstream-System einfließt. Dazu gehören Formatvalidierung, Schwellenwertprüfungen, Dubletten-Erkennung, Abstimmung, Abgleich und Ausnahmeflagging.

Integration für Aktion: Extrahierte Daten müssen in ERP-Systeme einfließen, Genehmigungsworkflows auslösen, Lieferanteninformationen aktualisieren und Zahlungsdateien generieren. Dazu sind speziell entwickelte Konnektoren und ein Verständnis der Unternehmenssystemarchitektur erforderlich.

Ein Forschungsbericht über hybride OCR-LLM-Rahmenbedingungen für die Extraktion von Unternehmensdokumenteninformationen unter einer copy-reichen Aufgabe fand heraus, dass die Kombination dieser Ansätze eine fast perfekte Genauigkeit mit einer Latenz von weniger als einer Sekunde lieferte, Ergebnisse, die weder OCR noch LLMs alleine erreichten.

Was zu suchen ist

Bei der Bewertung von AP-Automatisierungstools ist der Demo-Teil der einfache Teil. Der echte Test besteht darin, zu verstehen, was passiert, wenn die Realität von dem abweicht, was im Testfall gezeigt wird.

Führen Sie einen Pilotversuch mit Ihren tatsächlichen Rechnungen durch: Überspringen Sie die kuratierten Beispiele und experimentieren Sie mit Ihren unordentlichsten, inkonsistentesten Lieferantenrechnungen, einschließlich derjenigen mit handschriftlichen Notizen, schlechter Scannqualität und nicht standardisierten Formaten. Ein fähiges System sollte mit Formatvariabilität umgehen können, ohne dass Wochen der Modelltrainings oder neue Vorlagen für jeden Lieferanten erforderlich sind. Suchen Sie nach adaptiver Extraktion, die aus Korrekturen lernt und sich im Laufe der Zeit verbessert, anstatt zu brechen, wenn sie auf etwas Neues stößt.

Fragen Sie nach der Integrations Tiefe: Bestimmen Sie, ob es sich um einen vorgefertigten Konnektor mit bidirektionalem Sync oder einen generischen API handelt, der eine benutzerdefinierte Entwicklung erfordert. Das richtige Tool sollte native Konnektoren für große ERP-Systeme wie SAP, NetSuite und QuickBooks bieten, mit Echtzeit-Bidirektionssync. Die Integration ist eine Konfiguration und kein sechsmonatiges Implementierungsprojekt.

Verstehen Sie die Abstimmungslogik: Finden Sie heraus, ob es eine dreifache Abstimmung durchführen kann, und was passiert, wenn es eine Abweichung gibt. Ein robustes System sollte Rechnungen automatisch mit Bestellungen und Lieferscheinen abstimmen, Ausnahmen basierend auf konfigurierbaren Toleranzschwellen markieren und Abweichungen an den richtigen Genehmiger basierend auf Regeln weiterleiten, die Sie kontrollieren. Saubere Rechnungen sollten ohne menschliche Berührung durchlaufen, während Ausnahmen mit voller Kontext für eine schnelle Lösung an die Oberfläche gebracht werden.

Überprüfen Sie die Prüfspur: Stellen Sie sicher, dass Sie jedes Feld zurück zu seinem Quelldokument zurückverfolgen und sehen können, wer was und wann genehmigt hat. Eine Unternehmens-AP-Automatisierung sollte eine vollständige Rückverfolgbarkeit von der Rechnungseingabe bis zur Zahlung aufrechterhalten, mit Zeitstempeln, Benutzerzuweisung und Dokumentenverknüpfung bei jedem Schritt. Wenn Prüfer Fragen stellen, sollten Sie in der Lage sein, diese in Minuten und nicht in Tagen zu beantworten.

Fragen Sie nach der Preisgestaltung im großen Maßstab: Wenn die Kosten nutzungsabhängig sind, berechnen Sie, was Sie bei 10-mal Ihrem aktuellen Volumen zahlen würden, da einige Tools auf Unternehmensebene wirtschaftlich nicht tragbar werden. Vorhersehbare Preisgestaltung ist wichtig, daher suchen Sie nach Modellen, die Sie nicht für das Wachstum bestrafen oder basierend auf API-Verbrauch unvorhersehbar ansteigen. Die Kosten pro Rechnung sollten mit zunehmendem Volumen sinken und nicht steigen.

Testen Sie die Ausnahmen: Reichen Sie absichtlich Rechnungen ein, die die Validierung fehlschlagen sollten, um zu sehen, wie das System reagiert. Ein Tool, das alles automatisch genehmigt, automatisiert nicht. Es rubber-stampet. Das richtige System sollte Fehler erkennen, Anomalien markieren und menschliches Urteil dort erfordern, wo es angebracht ist, während es genügend Kontext für Prüfer bietet, um schnelle Entscheidungen zu treffen.

Auswahl des richtigen Fits

Der AP-Automatisierungsmarkt ist rapide gewachsen, da die Markteintrittsbarrieren gesunken sind. Das Erstellen eines grundlegenden LLM-Wrappers ist jetzt einfach, aber das Erstellen von Systemen, die in Unternehmensumgebungen bestehen, erfordert eine andere Ebene der Ingenieurskunst.

Wenn Sie nur Daten aus moderaten Rechnungsvolumina mit standardisierten Formaten extrahieren und manuelle Überprüfung tolerieren können, kann eine leichtere Lösung gut geeignet sein. Wenn Sie jedoch Tausende von Rechnungen in verschiedenen Formaten, Sprachen und Währungen verarbeiten, benötigen Sie eine tiefere Infrastruktur. Sie benötigen Echtzeit-ERP-Integration, konfigurierbare Workflows, benutzerdefinierte Genehmigungsketten und prüffähige Aufzeichnungen, die der Unternehmensrealität standhalten.

Ayesha Amjad ist die Gründerin und CPO von Docspire, die branchenspezifische Dokumentenintelligenz für branchen mit hohem Dokumentenaufkommen bereitstellt. Als erfahrene AI-Produktleiterin und Forscherin spezialisiert sie sich auf unternehmensgrade AI für Datenintegration, Dokumentenintelligenz und Automatisierung. Ayesha hat die Entwicklung von preisgekrönten, umsatzgenerierenden AI-Produkten geleitet und berät regelmäßig Organisationen bei der verantwortungsvollen Einsetzung von AI im großen Maßstab.