Die häufigste Frage unserer Kunden

„Wie viele Trainingsdaten brauche ich?" – diese Frage hören wir in praktisch jedem Projekt. Die Antwort ist naturgemäß komplex, aber nach über 200 abgeschlossenen Projekten können wir belastbare Empfehlungen geben.

Grundregel: Qualität vor Quantität

Mehr Daten helfen nur, wenn sie die reale Varianz Ihrer Produktion abbilden. 500 Samples aus einer Schicht mit identischen Maschinenparametern sind weniger wert als 200 Samples, die über verschiedene Chargen, Schichten und Temperaturprofile verteilt sind.

Empfohlene Mindestmengen

  • i. O.-Samples: Mindestens 200, ideal 500+, über mindestens 3 Produktionslose verteilt
  • n. i. O.-Samples: Mindestens 30 pro Fehlerklasse, ideal 50+, mit repräsentativer Schweregrad-Verteilung
  • Grenzfälle: 10–20 Proben im Graubereich zwischen i. O. und n. i. O. verbessern die Trennschärfe erheblich

Datenerfassung über mehrere Schichten

Fertigungsprozesse unterliegen systematischen Schwankungen: Werkzeugverschleiß, Temperaturgang, Chargenunterschiede im Rohmaterial. Ein robuster Klassifikator muss diese Varianz kennen. Unsere Empfehlung:

  • Daten über mindestens 5 Produktionstage sammeln
  • Früh-, Spät- und Nachtschicht einbeziehen
  • Materialchargen-Wechsel dokumentieren und als Metadaten erfassen
  • Saisonale Effekte berücksichtigen (Temperatur, Luftfeuchte)

Labeling-Strategie

Die Qualität der Labels ist mindestens so wichtig wie die Menge der Daten. Setzen Sie auf ein 4-Augen-Prinzip: Zwei unabhängige Prüfer bewerten jeden Prüfling. Bei Diskrepanzen entscheidet ein dritter Experte. Das kostet initial mehr Zeit, verhindert aber systematische Fehler im Modell.

Fazit

Gute Trainingsdaten sind die Grundlage für zuverlässige akustische Klassifikatoren. Investieren Sie Zeit in eine durchdachte Sammelstrategie – die Amortisation kommt schnell durch niedrigere Pseudoausschuss-Raten und höhere Detektionssicherheit in der Serienprüfung.