Ziel: Mit wenigen Kennzahlen den Einsatz der KI sichtbar steuern – ohne Reporting-Overhead.
Siehe Glossar: KPI, Logging/Protokollierung, Übersteuern.


1) Die 6 KPIs (Definition + Formel)

  1. Trefferqualität (Precision@Einladung)
    Wie oft waren Einladungen im Nachgang „richtig“?
    Formel: Einladungen, die nach Gespräch/Prüfung bestätigt wurden ÷ alle Einladungen
    Beispiel: 18/24 = 0,75

  2. Übersteuerungsquote
    Wie oft musste gegen die KI-Empfehlung eingegriffen werden?
    Formel: Anzahl Übersteuerungen ÷ alle Fälle
    Beispiel: 7/80 = 0,0875

  3. Anteil Grenzfälle
    Wie groß ist die Zone, in der manuell geprüft wird?
    Formel: Fälle mit „Manuelle Prüfung“ ÷ alle Fälle
    Beispiel: 22/80 = 0,275

  4. Durchlaufzeit (Median)
    Wie schnell vom Eingang bis Entscheidung?
    Formel: Median(Entscheidungszeit – Eingangszeit)
    Hinweis: Ausreißer per Median abpuffern.

  5. Fehler-/Rework-Rate
    Wie oft musste eine getroffene Entscheidung später korrigiert werden?
    Formel: Korrekturen ÷ alle Entscheidungen
    Beispiel: 2/80 = 0,025

  6. Bias-Indikator (relativer Vergleich)
    Gibt es systematische Unterschiede zwischen Gruppen?
    Formel (einfach): Trefferqualität Gruppe A ÷ Gruppe B
    Interpretation: Werte < 0,8 oder > 1,25 anschauen.


2) Minimal-Setup (Datenbasis)

Damit die Formeln funktionieren, braucht ihr im Log (siehe /demos/):

  • decision (z. B. einladen, manuelle_pruefung, ablehnen)
  • override.applied (true/false)
  • timestamps (Eingang/Entscheidung)
  • optional: group für Bias-Indikator (nur wenn rechtlich zulässig/vertretbar)

Tipp: Nutzt eindeutige REQ-* und LOG-* IDs, damit ihr später sauber auswerten könnt.


3) Zielwerte (Startvorschlag)

  • Trefferqualität ≥ 0,7 (steigern auf 0,8+)
  • Übersteuerungsquote 5–15 % (zu hoch → Schwellen prüfen; zu niedrig → Oversight greift evtl. nicht)
  • Durchlaufzeit: Median definieren (z. B. ≤ 3 Werktage)
  • Fehler-/Rework-Rate < 3 %
  • Bias-Indikator zwischen 0,8–1,25

Das sind Startwerte – nach 1–2 Zyklen mit euren Daten anpassen.


4) Mini-Checkliste (monatlich/vierteljährlich)

  • [ ] Logs vollständig? (Version/ID, Score, Entscheidung, ggf. Override)
  • [ ] KPIs berechnet und grafisch kurz kommentiert („Warum rauf/runter?“)
  • [ ] Maßnahmen abgeleitet (Schwellen/SOP/Training anpassen)
  • [ ] Nachweise im Audit Proof Pack abgelegt

5) Nächste Schritte