Bewertungsskala & Likert – Scale


Warum Bewertungsskala und einheitlicher Bewertungsmaßstab?

Alle Messverfahren, Prüfungen oder Umfragen liefern zunächst lediglich Meßwerte – Daten in qualitativer oder quantitativer Form. Eine Entscheidung, ob der Meßwert „gut“ oder „schlecht“ ist, kann erst nach Anwendung eines Bewertungsverfahrens getroffen werden. Ein wesentliches Kernelement aller Bewertungsverfahren ist die verwendete Bewertungsskala.

Was erfahren Sie in diesem Beitrag? – Inhalte

numerische Bewertungsskala vs. verbale Bewertungskala

Je nach Zielsetzung der Prüfung / Befragung werden unterschiedliche Bewertungsskalen verwendet z.B. eine

  • numerische Bewertungsskala (z. B. Schulnoten von 1 bis 6, Bewertungsskala von 1 -10)
  • verbale Bewertungsskalen (z. B. von „Sehr unwahrscheinlich“ bis „Sehr wahrscheinlich“, „Sehr gut“ bis „Sehr schlecht“)

einheitlicher Bewertungsmaßstab wichtig für spätere Entscheidung

Die Skalierung ist der erste Schritt um zu einem einheitlichen Beurteilungsmaßstab zu gelangen. Im Fall einer numerischen Skalierung ist es sinnvoll – um ein gemeinsames, einheitliches Verständnis zu erreichen und die spätere Beurteilung zu ermöglichen –  für jede Stufe der Skala eine Zuordnung im Sinne von „gut“- „akzeptabel“ – „schlecht“ zu vereinbaren. Erst danach werden die Wertgrenzen festgelegt und Werte zugeordnet.

Numerische Skala

Eine numerische Skala wird häufig verwendet bei quantitativen Messverfahren, die Messwerte liefern. Die (stufenlos) anfallenden Messwerte müssen lediglich gruppiert und der entsprechenden Stufe zugeordnet werden.  

Der wesentliche Vorteil der numerischen Skala ist ihre Einfachheit. Zahlensysteme und Rangfolge werden meist intuitiv verstanden und verwendet. Eine numerischen Skala erlaubt eine statistische Auswertung. Die Darstellung der Ergebnisse kann z.B. als Histogramm erfolgen.

Wichtig ist hier, festzulegen ob ein hoher oder niedriger Zahlenwert das „Sehr gut“ symbolisiert. Um im deutschen Schulnotensystem zu bleiben: Ist eine „1“ sehr gut (wie in der Grundschule oder ist „15“ (Punkte) sehr gut?

Verbale Bewertungsskalen werden gern bei Umfragen verwendet um Stimmungsbilder oder subjektive Einschätzungen abzufragen.  Bei Qualitätsprüfungen kann z.B. ein Fehlerbild „Kratzer“ mit Stufen von „sehr viele Kratzer“ bis „keine Kratzer erkennbar“ beschrieben werden.

Die Auswertung der Prüf- oder Umfrageergebnisse mit einer verbalen Bewertungsskala kann in der Regel nur nach Häufigkeit der Nennung erfolgen. Soll eine weitergehende statistische Auswertung erfolgen,  müssen die qualitativen Anworten skaliert und in numerische Zahlenwerte umgewandelt werden.

Skalierung von verbalen Bewertungskalen, Ratingskala, Likertskala

Skalierung bedeutet, dass die subjektiv, qualitativ oder verbal bewerteten Stufen einer verbalen Bewertungsskala einer numerischen Bewertungsskala mit Rangfolge zugeordnet werden. Im englischsprachigen Kulturkreis ist das Vorgehen als Likert – Scale bekannt.

Bewertungsskala Beispiele

Ein einfaches Beispiel für eine Bewertungsskala ist das Schulnoten-System:

  • ungenügend = 6
  • mangelhaft = 5
  • ausreichend = 4
  • befriedigend = 3
  • gut = 2
  • Sehr gut = 1

Die selbstverständliche  „Einfachheit“ besteht allerdings nur, wenn man nicht im angelsächsischen Kulturkreis aufgewachsen ist. Hier werden „A“ bis „F“ in der Regel intuitiv besser verstanden.

Ein Beispiel für eine Bewertungsskala aus dem Qualitätswesen:

  • sehr viele Kratzer = 6
  • viele Kratzer = 5
  • mehrere große und kleine Kratzer= 4
  • mehrere kleine Kratzer= 3
  • vereinzelt kleine Kratzer= 2
  • keine Kratzer erkennbar = 1

Vorteile und Nachteile von Bewertungsskalen

In Umfragen haben numerische Skalen trotz der vermeintlichen Objektivität einen wesentlichen Nachteil: Sie sind sehr subjektiv! Je nach Situation und Stimmung schwankt die Einschätzung der befragten Person. So kann ein Zahlenwert von 5 auf einer Skala von 1 bis 10 alles von „sehr gut“ bis „unbrauchbar“ bedeuten.

Am Schulbeispiel zeigt sich die Problematik deutlich:

Mathematik:

  • Rechenweg richtig, Ergebnis richtig = sehr gut = 1

Deutsch:

  • Diktat: Übereinstimmung mit der Vorgabe „Duden“ 100% =  sehr gut = 1
  • sprachliche Ausdrucksfähigkeit:  gut?, schlecht? … Wie gute sprachliche Ausdrucksfähigkeit definiert und wie wird gemessen?

Eine weitere Tendenz bei „subjektiven“ Bewertungsskalen ist auffällig: Extremwerte werden seltener vergeben als Werte aus der Skalenmitte – häufig als Folge persönlicher Hemmung.

qualitative Merkmalsprüfung in der Qualitätsprüfung – Grenzmuster

Ein ähnliches Problem ist in der qualitativen Merkmalsprüfung in der Qualitätsprüfung z.B. in der Prozesskontrolle oder im Wareneingang zu beobachten. Für ein identisches Prüfobjekt schwankt je nach Prüfer und Tagesform die Beurteilung erheblich z.B. von „sehr viel Kratzer = 6 “ bis „mehrere, kleine Kratzer= 3“. … Immerhin werden einstimmig Kratzer erkannt.

Eine Lösung um die Streung der Prüfergebnisse einzugrenzen, ist die Verwendung von Grenzmustern. In einem Grenzmusterkatalog findet der Prüfer für jede Bewertungsstufe  Vergleichsobjekte, die die typische Merkmalsausprägung für die jeweilige Skalenstufe zeigen. In einer Messsystemanalyse MSA wird dies überprüft entsprechend den jeweiligen Norm-Vorgaben, z.B.  VDA Band 5 oder AIAG.

Im Falle von Umfragen mit verbalen Bewertungskalen werden Erläuterungen und Deskriptoren zur jeweiligen Stufe an die Hand gegeben um ein einheitlicheres Verständnis zu erreichen.

Hohe Ausschußzahlen? Schwankende Produktqualität?

Beratung  im Qualitätsmanagement und Qualitätsprüfung

Wir unterstützen Sie im Qualitätsmanagement bei der Prozessüberwachung und Prozessoptimierung Wir schulen Sie und Ihre Mitarbeiter in den Methoden des Qualitätsmanagements.

Hohe Ausschußzahlen und schwankende Produktqualität können durch Ihr Prüfsystem verursacht werden! Wir können helfen. Hier ist Ihr Kontakt zu uns.


« Back to Glossary Index