Zum Inhalt springen

Document Agents

Echtes Sprachverständnis. Keine Template-Erkennung.

Airbus Volkswagen Shell Renault Evonik Vattenfall Philips KPMG

Auf einen Blick

99,1% Zero-Touch

Routinedokumente autonom verarbeitet - ohne manuelle Nachbearbeitung

20+ Dokumenttypen

Rechnungen, Verträge, Krankmeldungen, Bescheide, Belege und mehr

Echtes Verständnis

Kontextuelles Sprachverständnis statt OCR-Template-Matching

Decision Layer

Jede Extraktion mit Confidence Score, Regelversion und Audit Trail

Modell-agnostisch

Claude, ChatGPT, Gemini, Llama - Modell austauschbar

SAP, DATEV, Workday

Integration über APIs - Agent-Logik vom Zielsystem entkoppelt

Definition: Document Agent

Ein Document Agent ist ein spezialisierter AI Agent für die automatische Verarbeitung von Enterprise-Dokumenten. Er nutzt Large Language Models (LLMs) für kontextuelles Sprachverständnis - nicht Template-Matching, nicht starre OCR-Regeln.

Der Document Agent liest ein Dokument, versteht seinen Inhalt und trifft eine fachliche Bewertung. Diese Bewertung wird über den Decision Layer geprüft, dokumentiert und in den Audit Trail geschrieben.

Was Document Agents verarbeiten

  • Eingangsrechnungen und Gutschriften
  • Krankmeldungen und ärztliche Bescheinigungen
  • Arbeitsverträge und Vertragsänderungen
  • Bescheinigungen und Nachweise
  • Belege, Quittungen und Reisekostenabrechnungen
  • Steuerbescheide und Behördenschreiben

Wie eine Entscheidung entsteht

Dokument    →  Agent liest     →  Decision Layer prüft
(Rechnung)     und versteht       Vollständigkeit, Plausibilität,
Steuerklassifikation
│
┌────────────┴────────────┐
│                         │
Hohe Confidence           Niedrige Confidence
Regel eindeutig          oder Ausnahmefall
│                         │
Buchungsvorschlag         Eskalation an
+ Audit Trail            Sachbearbeiter

Bei hoher Confidence und eindeutiger Regelanwendung: autonome Verarbeitung mit vollständigem Audit Trail. Bei niedriger Confidence, Ausnahmefällen oder fehlenden Informationen: Eskalation an einen Sachbearbeiter - mit dem gesamten Kontext, den der Agent bereits extrahiert hat. In Kombination mit einem Workflow Agent wird der gesamte Prozess End-to-End orchestriert.

Decision Layer für Dokumente

Jede Dokumentenverarbeitung erzeugt einen vollständigen Entscheidungsdatensatz:

  • Input: Dokument-Hash, Dokumenttyp, extrahierte Felder
  • Regelwerk: Angewandte Regel, Version, Timestamp
  • Bewertung: Confidence Score, Risiko-Score
  • Ergebnis: Buchungsvorschlag oder Eskalation
  • Routing: Autonome Entscheidung oder Human-in-the-Loop

Der Document Agent ersetzt keine Sachbearbeiter. Er verarbeitet die Routinefälle autonom und eskaliert Ausnahmefälle an Menschen - mit vollständiger Dokumentation. Mehr zum Decision Layer Architekturprinzip.

Document Agent vs. OCR vs. manuell

Document Agent OCR-System Manuelle Bearbeitung
Verständnis Kontextuell - versteht Inhalt und Bedeutung Zeichenerkennung + Template-Matching Volle kognitive Leistung
Freitext / Handschrift Ja - echtes Sprachverständnis Eingeschränkt - bricht bei Abweichungen Ja
Geschwindigkeit Sekunden pro Dokument Sekunden, aber oft Nachbearbeitung 5-10 Minuten pro Dokument
Skalierung Linear mit Volumen Linear, aber manuell bei Fehlern Nur mit mehr Personal
Audit Trail Automatisch pro Entscheidung Begrenzt Manuell, oft lückenhaft

Praxis: Eingangsrechnungen

Szenario: 500 Eingangsrechnungen pro Monat

Vorher (manuell)

  • 8 Minuten pro Rechnung (Sichtung, Kontierung, Prüfung)
  • ~67 Stunden pro Monat
  • Fehlerquote bei Kontierung: 4-6%
  • Audit Trail: Excel-Liste, manuell gepflegt

Nachher (Document Agent)

  • 99,1% autonom verarbeitet (495 von 500 Rechnungen)
  • <1% an Sachbearbeiter eskaliert (~5 Rechnungen/Monat)
  • 98% aller Rückfragen mit dem Belegeinsender selbständig geklärt
  • <0,5h manueller Aufwand pro Monat
  • Fehlerquote: unter 0,3% (regelbasierte Kontierung)

Ergebnis: Von 67 Stunden auf unter 30 Minuten pro Monat. Der Agent kontiert, prüft und bucht autonom. Bei fehlenden Angaben (z.B. Bestellnummer, Kostenstelle) fragt der Agent selbständig beim Belegeinsender nach - 98% dieser Rückfragen werden ohne menschliches Eingreifen gelöst. Nur echte Ausnahmen landen beim Sachbearbeiter.

Human-in-the-Loop

Agent entscheidet: Kontierung, Buchungsvorschlag, Zahlungsbedingungen, Rückfragen an Belegeinsender.
Mensch entscheidet: Erstmalige Lieferanten-Freigabe, Rechnungen über Freigabe-Schwellenwert, Abweichungen von Bestellwert >5%.

Einsatzbereiche

Finance & Accounting

Rechnungsverarbeitung, Kontierung, Belegprüfung. Integration mit DATEV und SAP FI/CO. Vorkonfigurierte Lösung: Finance AI Agents.

HR & People Operations

Krankmeldungen, Vertragsdokumente, Bescheinigungen. Integration mit SAP SuccessFactors und Workday. Vorkonfigurierte Lösung: HR AI Agents.

Compliance & Audit

Automatische Prüfung eingehender Dokumente gegen interne Richtlinien und externe Regulierungen. Der Decision Layer dokumentiert jede Prüfentscheidung.

Integration

Document Agents sind über standardisierte Schnittstellen an bestehende Systeme angebunden:

  • SAP FI/CO, SAP S/4HANA
  • DATEV
  • SAP SuccessFactors, Workday
  • SharePoint, Microsoft Teams
  • E-Mail-Eingänge (IMAP/Exchange)
  • Weitere über REST/SOAP

Die Agent-Logik ist vom Zielsystem entkoppelt. Ein Wechsel des ERP-Systems ändert die Exportschicht - nicht den Agenten. Sie haben einen Prozess, der keinen der drei Standard-Agent-Typen abdeckt? Co-Build liefert individuelle Agenten in 4-6 Wochen.

Häufige Fragen zu Document Agents

Was ist ein Document Agent?

Ein Document Agent ist ein spezialisierter AI Agent, der Enterprise-Dokumente mit echtem Sprachverständnis liest, versteht und verarbeitet. Er ersetzt keine Sachbearbeiter, sondern verarbeitet Routinefälle autonom und eskaliert Ausnahmen an Menschen - mit vollständiger Dokumentation über den Decision Layer.

Welche Dokumente verarbeitet ein Document Agent?

Eingangsrechnungen, Gutschriften, Krankmeldungen, Arbeitsverträge, Vertragsänderungen, Bescheinigungen, Belege, Quittungen, Steuerbescheide und weitere strukturierte sowie unstrukturierte Geschäftsdokumente.

Wie unterscheidet sich ein Document Agent von OCR?

OCR erkennt Zeichen auf einem Bild. Ein Document Agent versteht den Inhalt: Er erkennt den Dokumenttyp, extrahiert relevante Daten, prüft die fachliche Plausibilität und trifft eine Klassifizierungsentscheidung. Jede Entscheidung wird über den Decision Layer dokumentiert und ist auditierbar.

Welche Dokumente soll Ihr erster Agent verarbeiten?

Sprechen Sie mit uns über Ihren konkreten Anwendungsfall.