Best Practice: ML-Trainingsdaten für Akustik

Die häufigste Frage unserer Kunden

„Wie viele Trainingsdaten brauche ich?" – diese Frage hören wir in praktisch jedem Projekt. Die Antwort ist naturgemäß komplex, aber nach über 200 abgeschlossenen Projekten können wir belastbare Empfehlungen geben.

Grundregel: Qualität vor Quantität

Mehr Daten helfen nur, wenn sie die reale Varianz Ihrer Produktion abbilden. 500 Samples aus einer Schicht mit identischen Maschinenparametern sind weniger wert als 200 Samples, die über verschiedene Chargen, Schichten und Temperaturprofile verteilt sind.

Empfohlene Mindestmengen

i. O.-Samples: Mindestens 200, ideal 500+, über mindestens 3 Produktionslose verteilt
n. i. O.-Samples: Mindestens 30 pro Fehlerklasse, ideal 50+, mit repräsentativer Schweregrad-Verteilung
Grenzfälle: 10–20 Proben im Graubereich zwischen i. O. und n. i. O. verbessern die Trennschärfe erheblich

Datenerfassung über mehrere Schichten

Fertigungsprozesse unterliegen systematischen Schwankungen: Werkzeugverschleiß, Temperaturgang, Chargenunterschiede im Rohmaterial. Ein robuster Klassifikator muss diese Varianz kennen. Unsere Empfehlung:

Daten über mindestens 5 Produktionstage sammeln
Früh-, Spät- und Nachtschicht einbeziehen
Materialchargen-Wechsel dokumentieren und als Metadaten erfassen
Saisonale Effekte berücksichtigen (Temperatur, Luftfeuchte)

Labeling-Strategie

Die Qualität der Labels ist mindestens so wichtig wie die Menge der Daten. Setzen Sie auf ein 4-Augen-Prinzip: Zwei unabhängige Prüfer bewerten jeden Prüfling. Bei Diskrepanzen entscheidet ein dritter Experte. Das kostet initial mehr Zeit, verhindert aber systematische Fehler im Modell.

Fazit

Gute Trainingsdaten sind die Grundlage für zuverlässige akustische Klassifikatoren. Investieren Sie Zeit in eine durchdachte Sammelstrategie – die Amortisation kommt schnell durch niedrigere Pseudoausschuss-Raten und höhere Detektionssicherheit in der Serienprüfung.

Die häufigste Frage unserer Kunden

Grundregel: Qualität vor Quantität

Empfohlene Mindestmengen

Datenerfassung über mehrere Schichten

Labeling-Strategie

Fazit

Weitere Beiträge

Bereit, akustische Prüftechnik in Ihrer Linie zu erleben?

Bevor Sie gehen – unser Whitepaper für Sie.

Best Practice: ML-Trainingsdaten für Akustik

Die häufigste Frage unserer Kunden

Grundregel: Qualität vor Quantität

Empfohlene Mindestmengen

Datenerfassung über mehrere Schichten

Labeling-Strategie

Fazit

Weitere Beiträge

RTE Prüfgesang – Qualität, die man hören kann

SonicTC 2026.2: ML-Update & PROFINET-S2

Neues Whitepaper: Akustische Prüfung vs. CT/Röntgen

Bereit, akustische Prüftechnik in Ihrer Linie zu erleben?