Trainingsdaten
Kurz erklärt
Qualität, Herkunft und Abdeckung der Trainingsdaten bestimmen, wie fair, robust und generalisierbar ein System arbeitet.
Beispiele
- Dokumentation der Datenquellen und Lizenzlage.
- Abdeckung verschiedener Gruppen/Sprachen/Domänen.
Praxis-Tipps
- Datenkarten (Datasheets) pflegen.
- Testsets getrennt von Trainingsdaten halten.
- Bias-Analysen mit Gruppenmetriken durchführen.
Rechtsgrundlagen (EU AI Act)
- Art. 10 (Daten & Datengovernance)
- Bezüge: Art. 15 (Leistung/Sicherheit)