Stichprobe


Ziel der statistischen Untersuchung mit Hilfe einer Stichprobe ist es, durch die Analyse einer (kleinen) Stichprobe eine verläßliche Prognose oder Aussage über die (große) Grundgesamtheit machen zu können. Weil aus praktischen Gründen selten die Gesamtheit aller Objekte untersucht werden kann, beschränkt man sich auf eine Stichprobe. D.h. auf einer mehr oder minder großen Teilmenge einer Grundgesamtheit. Leider spiegeln Stichproben nicht immer die Grundgesamtheit wieder und streuen.

Stichproben streuen

Streuung zwischen mehreren Stichproben ist normal. Ebenso selten und wenig wahrscheinlich ist es in der Praxis, dass z.B. bei einer Wareneingangsprüfung eine Stichprobe exakt die Grundgesamtheit wiederspiegelt. Behinderungen des Zufalls werden als Verzerrung bezeichnet. Ziel ist es natürlich, eine “repräsentative” Stichprobe zu erhalten, die in ihren Eigenschaften mit möglichst geringen Abweichungen die Grundgesamtheit widerspiegelt.

Stichproben als Fehlerquelle in SPC

Umfang, Zeitpunkt und Art und Weise der Stichprobennahme können sehr große, häufig unerkannte Fehlerquellen sein und eine erfolgreiche Prognose über die Grundgesamtheit oder eine zuverläßige Prozesskontrolle durch SPC und Qualitätsregelkarten verhindern.

Wichtig für SPC ist, dass Art, Umfang, Zeitpunkt, Vorgehensweise der Stichprobennahme und Auswertung definiert sind, dass die Mitarbeiter darin geschult sind und die Arbeitsanweisung beachten.

Ebenso wichtig zur Interpretation einer oder mehrerer Stichproben ist die Angabe zur Bezugsgröße in absoluten Zahlen als auch in relativen Werten.

Stichproben Kriterien und typische Fehlerquellen

Stichproben liefern die Grundlage für verschiedene statistische Auswertungen und werden deshalb zielabhängig unter bestimmten Gesichtspunkten ausgewählt.
Wichtige Gütekriterien und Anforderungen an eine Stichproben sind z.B.

  • Stichprobengröße vs. Populationsgröße
  • Objektivität
  • Reliabilität
  • Validität
  • Repräsentativität/ Verzerrung

Stichprobengröße vs. Populationsgröße

Mit der Populationsgröße ist die Größe der Grundgesamtheit gemeint, der häufig nur geschätzt werden kann. Der Stichprobenumfang bezeichnet die Größe der Stichprobe. Je kleiner die Stichprobe und je größer die Grundgesamtheit, desto größer ist in der Regel die Fehlermarge – das “Konfidenzintervall”. Die statistische Theorie liefert eine Standardformel um bei kleineren Gesamtpopulationen die erforderliche Stichprobengröße zu berechnen.

Objektivität

Mit Objektivität einer statistischen Untersuchung wird beschrieben, ob und inwieweit die Auswertungsergebnisse individuellem menschlichem Einfluss z.B. durch die Art und Weise der Durchführung durch den Probennehmer, oder die Auswertung und Interpretation durch denAnalysten abhängen.

Reliabilität

Die Reliabilität  oder Zuverlässigkeit einer statistischen Untersuchung beschreibt, inwieweit wiederholte Messungen (natürlich unter gleichen Bedingungen) zu identischen Ergebnissen führen. Ähnliches erfolgt beim Verfahren 1 der Messsystemanalyse MSA. Angestrebt wird selbstverständlich eine hohe Reliabilität.

Validität

Mit Validität einer statistischen Untersuchung ist gemeint, ob tatsächlich das relevante, interessierende  Merkmal oder Kriterium gemessen wird oder ob stattdessen nur ein abgeleitetes oder gar ein Hilfskriterium gemessen und analysiert wird.

So ist die Messung der PKW-Geschwindigkeit mittels Tacho nur eine abgeleitete Größe aus Raddrehzahl pro Zeit und (vermutetem) Radumfang, die Messung mit Lichtschranke oder Radarpistole ist häufig genauer.

Repräsentativität / Verzerrung

Eine Verzerrung der Stichprobe (“bias”) ist ein Fehler bei der zufälligen Stichprobennahme, die z.B. aus organisatorischen, sozialen oder technischen Unzulänglichkeiten resultiert und die gewünschte zufällige Stichprobennahme be- oder verhindert. In der Folge unterscheiden sich die Eigenschaften der Stichprobe signifikant von der Grundgesamtheit.

Bei einigen Stichprobetypen wird bewußt von einer zufälligen Auswahl abgewichen z.B. um den erforderlichen Aufwand zu reduzieren und schneller verläßliche Ergebnisse über einee vorselektierte Zielgruppe zu erhalten. Z.B. wird bei einer Quotenstichprobe ganz bewußt eine Verzerrung eingeführt, d.h. es wird nicht per Zufall ausgewählt, sondern vordefinierte Quoten bestimmen über die Auswahl der Elemente der Stichprobe. Die Quoten können z.B. aus demografische Merkmalen einer Bevölkerung als Grundgesamtheit resultieren oder dass im Fall von Produkt-Rückruf-Aktionen Produktionschargen aus bestimmten Zeiträumen analysiert werden.

Tests und Messsysteme als Fehlerquellen

Die Verläßlichkeit von Messystemen und Prüfverfahren haben signifikanten Einfluss auf die Stichprobenergebnisse. Richtig-Positiv-Quoten und Richtig-Negativ-Quoten z.B. von klinischen Tests müssen zwingend bei der Interpretation der Stichprobenergebnisse berücksichtigt werden.

Stichprobe Beispiel aus der Praxis

Im Zuge eines Kostensenkungsprogramms wurden in einem Unternehmen die Qualitätsdaten der Fahrzeugendprüfung sowie die Nacharbeitskosten analysiert. Ein Teil der Endprüfung war die sogenannte Dichtigkeitsprüfung, bei der das Fahrzeug in einer Waschhalle bewässert wurde und auf Eindringen von Feuchtigkeit in den Innenraum geprüft wurde.

Analyse der Prozessdaten – Auffälligkeiten

Folgende Auffälligkeiten zeigten sich bei der Auswertung der Prozessdaten:

  1. die absolute Anzahl der Fahrzeuge, die wegen Undichtigkeit nachgearbeitet werden musste, war von Jahr zu Jahr gestiegen.
    (Jahr 1 = 100%, Jahr 2 = 108%, Jahr 3 = 102%, Jahr 4 118% über 3 Jahre)
  2. die Zahl undichter Fahrzeuge war in den Sommermonaten besonders hoch (ca.25%)
  3. Am Wochenende war die Anzahl undichter Fahrzeuge immer signifikant geringer (ca. 30%)
  4. Zu Wochenbeginn wurden gehäuft undichte Fahrzeuge gefunden (ca. 15%)
  5. von Mai bis Sept. des Vorjahres war die Anzahl undichter Fahrzeuge um ca. 30% gegenüber den Vorjahren zurückgegangen, um dann wieder auf ein ähnliches Niveau zurückzukehren

Stichprobenanalyse & Ursachenanalyse der Auffälligkeiten

Eine der ersten Feststellungen bei der Prozessanalyse und Ursachenanalyse war, dass nicht alle Fahrzeuge zu 100% auf Dichtigkeit, sondern nur etwa 10% aller gefertigten Fahrzeuge stichprobenartig geprüft wurden.

  1. die absolute Anzahl der Fahrzeuge, die wegen Undichtigkeit nachgearbeitet werden musste, war von Jahr zu Jahr gestiegen.  (Jahr 1 = 100%, Jahr 2 = 108%, Jahr 3 = 102%, Jahr 4 118% über 3 Jahre)
    –> Das Unternehmen hatte steigende Produktionszahlen in ähnlichem Umfang zu verzeichnen. Im Jahr 3 waren statt 10% nur 5% aller Fahrzeuge einer Dichtigkeitsprüfung unterzogen worden. Prozentual bezogen auf das produzierte Volumen hatte sich die Quote undichter Fahrzeuge nicht verändert.
  2. die Zahl undichter Fahrzeuge war in den Sommermonaten besonders hoch (ca.25%)
    –> Das Unternehmen produzierte u.a. PKW- Cabrios, deren Anteil an der Gesamtproduktion in den Sommermonaten um ca. 25% höher lag als in den Wintermonaten. Cabrios sind bekanntermaßen anfälliger für Undichtigkeiten im Test.
  3. Am Wochenende war die Anzahl undichter Fahrzeuge immer signifikant geringer (ca. 30%)
    –> Am Wochenende war die gesamte Prüfkapazität wegen Freischichten reduziert, im Bereich der Nassprüfung war die Kapazität nochmals reduziert wegen Wartungsarbeiten. Die Fertigung arbeitete uneingeschränkt durch. Es wurde deshalb nur ein geringerer Teil der Fahrzeuge endgetestet mit Nassprobe (= kleinere Stichprobe).
    Endgetestete Fahrzeuge ohne Nassprobe wurden für den Wochenbeginn geparkt.
  4. Zu Wochenbeginn wurden gehäuft undichte Fahrzeuge gefunden (ca. 15%)
    –> vom Wochenende geparkte, endgetestete Fahrzeuge ohne Nassprobe wurden in der Dichtigkeitsprüfung nachgeprüft (= größere Stichprobe)
  5. von Mai bis Sept. des Vorjahres war die Anzahl undichter Fahrzeuge um ca. 30% gegenüber den Vorjahren zurückgegangen, um dann wieder auf ein ähnliches Niveau zurückzukehren
    –> die Dichtigkeitsprüfung konnte auf 3 Prüfständen erfolgen. Im Zeitraum Mai bis Sept. war einer der Prüfstände defekt, die übrigen Prüfständen waren bereits ausgelastet. (= kleinere Stichprobe)
  6. Das Prüfvorgehen schwankte von Mitarbeiter zu Mitarbeiter stark. Es gab keine verbindlichen, einheitlichen Standards für “dicht”, “undicht” bzw. “i.O.” und “zur Nacharbeit”

zusammenfassende Bewertung der Stichproben im Praxisbeispiel

Zusammenfassend kann gesagt werden, dass die Stichproben auf der vorhandenen Datenbasis nur sehr eingeschränkt vergleichbar waren. Dies, weil sie sich in Bezug auf alle Anforderungen an Stichproben wie Stichproben- und Populationsgröße, Objektivität, Reliabilität, Validität und Repräsentativität/ Verzerrung z.T. erheblich unterschieden.

Stichprobe durchführen – Praxisempfehlungen

  • bei allen Kennzahlen absolute Werte (“Stück”, “Euro”) angeben und relative Werte (“%”) sowie Bezugsgröße
  • Größe der Stichprobe und Größe der Grundgesamtheit ( ggfs. auch als Schätzung) angeben.
  • Eindeutige Kriterien definieren für Stichprobe (vgl. Messsystemanalyse MSA) und Prüfstandards einführen
  • Prüfer und Mitarbeiter in den Prüfstandards (wiederholt) schulen
  • bei Vergleich verschiedener Stichproben Gütekriterien überprüfen
    • Stichprobengröße und Populationsgröße
    • Objektivität
    • Reliabilität
    • Validität
    • Repräsentativität/ Verzerrung

Schulung  & Beratung zu SPC und Prozessstabilisierung

Wir bieten offene Schulungen und inhouse-Training   zu SPC und Prozessoptimierung an.

Hilfe bei ungelöste Prozess- und Qualitätsproblem

Wir helfen Ihnen, Ihre Prozesse zu stabilisieren, Qualitätsprobleme zu eliminieren und führen SPC zur Prozesskontrolle ein. Wir freuen uns auf Ihre Anfrage. Hier ist Ihr Kontakt zu uns.