KRITIK: Ich gestehe, ich war zuerst verblüfft. Wer quantitative Beurteilungssysteme einsetzt, um Mitarbeiter bewerten zu lassen, muss damit rechnen, dass Männer bessere Noten als Frauen bekommen. Das ergab ein Experiment, bei dem Studenten ihre Dozenten bewerten sollten. Die Erklärung erstaunt ebenso wie die Lösung für das Problem (Leistungsbeurteilung: Was gegen Unfairness hilft).
Die Studenten sollten Noten auf einer Skala von 1 bis 10 vergeben, wobei 10 die Höchstnote war. In „den meisten männerdominierten Fächern“ erhielten die männlichen Dozenten signifikant bessere Bewertung als die Frauen. Das lässt sich ohne viel Fantasie auf die Unternehmenswelt übertragen.
Als man die Skala auf sechs Noten reduzierte, verschwand der Effekt. Der Grund: Die Beurteiler taten sich schwer, Frauen die Top-Noten 9 und 10 zu geben, während sie offenbar weniger Schwierigkeiten hatten, diese Höchstnoten für männliche Dozenten zu verteilen. Bei der Sechser-Skala hingegen erhielten Männer und Frauen gleichermaßen häufig die Sechs.
Unfaire Anker
Die Erklärung: Die 10 steht offenbar nicht nur für eine sehr gute Note, sondern für absolute Höchstleistung, für Genialität und Perfektion. Wer eine 10 verdient, hat Heldenstatus – und Helden sind offenbar eher Männer als Frauen. Also bleibt die 10 den Frauen in der Regel verwehrt, selbst bei Top-Leistungen. Bei einer 6er-Skala hingegen wird die Höchstnote nicht mit Perfektionismus und Heldenstatus assoziiert, also darf man sie auch für Frauen vergeben.
Da liegt es natürlich nahe, die Beurteilungskalen nicht zu sehr zu spreizen, damit solche Effekte ausbleiben. Mir stellt sich allerdings eine andere Frage: Was wird tatsächlich durch eine Note ausgedrückt? Offenbar deutlich mehr als die Bewertung einer Leistung. Nur wissen wir nie, was der Beurteiler sagen will. Dennoch tun wir immer so, als sei eine 5 eine 5 und stehe für Vergleichbares. Ein wesentlicher Grund, warum ich stark für qualitative Bewertungen von Verhalten und Leistungen bin. Da lässt sich zumindest begründen, warum jemand nicht mit dem höchsten Lob versehen wird … (Zur Originalstudie: Lauren Rivera / András Tilcsik: Scaling Down Inequality: Rating Scales, Gender Bias, and the Architecture of Evaluation. American Sociological Review 84(5) 03/2019)