Trainingsdaten

Kurz erklärt

Qualität, Herkunft und Abdeckung der Trainingsdaten bestimmen, wie fair, robust und generalisierbar ein System arbeitet.

Beispiele

  • Dokumentation der Datenquellen und Lizenzlage.
  • Abdeckung verschiedener Gruppen/Sprachen/Domänen.

Praxis-Tipps

  • Datenkarten (Datasheets) pflegen.
  • Testsets getrennt von Trainingsdaten halten.
  • Bias-Analysen mit Gruppenmetriken durchführen.

Rechtsgrundlagen (EU AI Act)

  • Art. 10 (Daten & Datengovernance)
  • Bezüge: Art. 15 (Leistung/Sicherheit)