Nochmal zu typischen Fehlvorstellungen über Geschlechterunterschiede und Normalverteilungen

Ich hatte hier eine kurze Sammlung verschiedener Fehlvorstellungen als Artikel eingestellt, die auch gerade einen Anfang darstellen sollte, von dem man aus weitere Abweichungen diskutieren kann.
In den Kommentaren wurde geliefert, so dass ich die dortigen Anmerkungen kurz noch mal in einem Artikel übernehmen will (vielen Dank für die guten Kommentare)

RW führte an:

Dann noch der Fall, wo die Verteilungskurven den gleichen Mittelwert, und nur unterschiedliche Breiten haben. Da ist die Apex Fallacy sehr beliebt.
Beispiel: IQ Verteilung, die bei Männern breiter gestreut ist als bei Frauen, aber den gleichen Peak haben. Erklärt warum es erheblich mehr männliche wissenschaftliche Genies gibt als weibliche. Feministische Interpretation: „Wenn Männer und Frauen gleichen IQ haben dann kann das nur Unterdrückung sein“. Dabei kehren sie komplett unter den Teppich, daß es auf der anderen Seite der Kurve viel mehr dümmere Männer gibt.

Es gibt ja sogar die Variante, wo derjenige sowohl der These zustimmt, dass es Frauen und Männer im Schnitt gleich intelligent sind und auch der These, dass es mehr dumme Männer gibt, die These, dass es dann aber auch mehr intelligentere Männer geben muss aber ablehnt.

Anne führte an:

zur Graphik 1:
Bei beiden Kurven wurde die gleiche Standardabweichung benutzt. Das trifft normalerweise so nicht zu.
I.A. streuen die Werte bei Männern stärker als bei Frauen.
In statistischen Themen unbedarfte Leser könnten auf die Idee kommen, dass alle Werte exakt auf den Kurven liegen. Tatsächlich gibt es auch davon Abweichungen und Ausreißer, die sich jedoch für große Anzahlen wieder herausmitteln.

Die Darstellung mit den beiden diskreten Werten könnte missverständlich wirken.
Wenn man die Standardabweichung gegen 0 gehen lässt, werden die „Glocken“ immer schmaler, aber gleichzeitig höher, da die Fläche unter der Kurve normiert ist und gleich bleiben muss. Man erhält schließlich Dirac-Delta-Peaks.

Selbst wenn die Mittelwerte μ gleich sind, so folgt bereits aus unterschiedlichen Standardabweichungen σ dass die Verteilungen weit voneinander abweichen können.
Ich habe das mal quick’n’dirty (evtuelle Unstimmigkeiten bitte ich zu entschuldigen) dargestellt im Bereich von ±3σ um den Mittelwert. Dabei unterscheiden sich die Standardabweichungen um ca. 20% voneinander.

Das ist in der Tat richtig, nicht alles sind vollkommen gleichartige Normalverteilungen, die nur verschobene Mittelwerte haben, es können auch sonst Unterschiede in der „Breite“ oder in anderen Bereichen auftreten.

Pingpong ergänzte:

Zum Thema: Bei der Gaussverteilung hängt der Maximalwert der Kurve auch von der Standardabweichung ab. Man sieht das oben in der Grafik von Anne, die Kurven haben den gleichen Mittelwert, aber die Kurve mit der größeren Standardabweichung ist kleiner. D.h. man kann keine zwei Gaussverteilungen erzeugen, die unterschiedliche Standardabweichungen aber trotzdem den gleichen Maximalwert haben – dazu muss man mindestens einmal den Maßstab anpassen.
Dass die Verteilungen von Merkmalen (z.b. Intelligenz, Mut, Risikobereitschaft, Affinität zu MINT etc) immer einer Gaussverteilung entspricht ist allerdings nicht von vornherein klar. Es könnte z.b. sein dass die Verteilung von Frauen annähernd eine Gaussverteilung ist, die von Männern aber schwerere Ränder (engl: heavy-tail distribution) hat. Damit kann man durchaus zwei Kurven bekommen, welche den gleichen Maximalwert haben, sich aber eben an den Rändern deutlich unterscheiden.

Also insoweit noch weitere Ausgestaltungen, die zu erheblichen Unterschieden führen können und die Differenzierung zwischen „Standardabweichung“ und „Mittelwert“. Ich führe ja häufig an, dass Unterschiede zwischen den Geschlechtern nicht absolut sind, sondern häufig Normalverteilungen mit sich überlappenden Trägern aber abweichenden Mittelwert. Sollte ich dann wohl um die evtl Standardabweichung ergänzen.

Kibo schrieb:

Genauso ist es und nach meiner Meinung ist die unterschiedliche Standardabweichung die bessere Erklärung für einige (statistische) Unterschiede zwischen den Geschlechtern. Ich gehe sogar davon aus, dass vielen, die sich mit Statisktik gut auskennen, dieser Effekt nicht wirklich bewusst ist. Im Qualitätsmanagement (z.B. Six Sigma) möchte man im Allgemeinen möglichst geringe Streuungen haben, was dazu führt, dass eine kleine Standardabweichung besser ist als eine größere. D.h. die Gaußkurve sollte möglichst schmal sein. Bei Betrachtung des Geschlechterverhältnis ist es aber häufig anders. Die geringere Standardabweichung bei den Frauen führt zum geringeren Anteil an wichtigen Positionen.

Ich habe hier ein Beispiel konstruiert, wo die rote Kurve die Verteilung einer Eigenschaft innerhalb der W-Gruppe (z.B. weibliche Personen) zeigt und die blaue Kurve die Verteilung einer Eigenschaft innerhalb der M-Gruppe (z.B. männliche Personen). Auf der X-Achse soll ein größerer Wert besser sein als ein kleiner, d.h. 0 ist richtig schlecht und 100 ist nahezu perfekt. Auf dem ersten Blick sieht es so aus, dass die W-Gruppe (rot) besser als die M-Gruppe (blau) abschneidet. Der Mittelwert der W-Gruppe ist z.B. deutlich besser als die der Mittelwert der M-Gruppe. Wenn man sich aber die Extreme anschaut, dann sieht man den Unterschied. Ich habe jetzt im nächsten Bild die gleichen Kurven nur im Bereich 90 bis 100 dargestellt.

Das bedeutet, dass es deutlich mehr Personen der M-Gruppe gibt, die zu den allerbesten gehören (besser als 90), obwohl die W-Gruppe soviel besser im Mittelwert ist. In der Praxis interessieren die Mittelwerte nicht wirklich. Wer erfolgreich sein will muss besser als der Durschnitt sein. Unternehmen bezahlen für die besten Spezialisten die besten Gehälter, wer nur durschnittliche Eigenschaften der gesuchten Spezialrichtung vorweisen kann, wird möglicherweise nicht mal zum Vorstellungsgespräch eingeladen oder muss sich mit weniger Gehalt zufrieden geben.

Männer sind tatsächlich das diversere Geschlecht, dh. die Streuung ist viel stärker unter Männer als unter Frauen. Das führt dazu, das sie bei den Spitzenjobs viel stärker vertreten sind. Aber das ist halt nur die eine Seite der Medaille. Sie sind halt auch viel stärker unter den Verlierern (z.B. Obdachlose) unserere Gesellschaft vertreten.

Das zeigt noch einmal, dass Unterschiede im Spitzenbereich ganz besonders groß ausfallen können, selbst wenn der sonstige Unterschied nicht so groß ist und das für viele Bereiche gerade dieser Spitzenbereich der wichtigste ist, weil aus diesem besonders wichtige Positionen besetzt werden.

Auch dieser Beitrag kann gerne über weitere Kommentare ergänzt werden, damit da noch mehr Informationen zusammen kommen.