Stereotype threat kann erneut nicht repliziert werden

Der Stereotype Threat besagt im wesentlichen, dass zB Mädchen in einem Bereich, bei dem das Stereotyp besteht, dass Frauen dort schlechter sind, schlechter abschneiden, wenn man sie daran erinnert, dass sie Mädchen sind.

Allerdings zeigt sich gerade in vorangemeldeten Studien, dass eine Replizierung entsprechender Studien nicht gelingt. Was die Vermutung aufwirft, dass der Stereotype Threat anfällig für einen Publication Bias ist:

Der Publikationsbias auch Publikationsverzerrung ist die statistisch verzerrte (engl. bias [ˈbaɪəs]) Darstellung der Datenlage in wissenschaftlichen Zeitschriften infolge einer bevorzugten Veröffentlichung von Studien mit „positiven“ bzw. signifikanten Ergebnissen.“

Der Stereotype Threat war auch schon Thema hier:

In einer neuen, vorangemeldeten Studie wurde nun erneut der Stereotype Threat untersucht:

Stereotype threat has been proposed as one cause of gender differences in post-compulsory mathematics participation. Danaher and Crandall argued, based on a study conducted by Stricker and Ward, that enquiring about a student’s gender after they had finished a test, rather than before, would reduce stereotype threat and therefore increase the attainment of women students. Making such a change, they argued, could lead to nearly 5000 more women receiving AP Calculus AB credit per year. We conducted a preregistered conceptual replication of Stricker and Ward’s study in the context of the UK Mathematics Trust’s Junior Mathematical Challenge, finding no evidence of this stereotype threat effect. We conclude that the ‘silver bullet’ intervention of relocating demographic questions on test answer sheets is unlikely to provide an effective solution to systemic gender inequalities in mathematics education.

Quelle: Stereotype threat, gender and mathematics attainment: A conceptual replication of Stricker & Ward

 

Aus der Studie:

Our goal in this paper is to report a conceptual replication of Stricker and Ward’s [10] investigation of stereotype threat in an authentic high-stakes setting, using the analysis approach favored by Danaher and Crandall [9]. Such a replication is timely, as since Stricker and Ward’s [10, 11] debate with Danaher and Crandall [9], several researchers have questioned the reliability of lab-based stereotype threat research. One reason is that attempts to replicate Spencer et al.’s [5] original lab study have not always been successful [e.g., 18]. Stoet and Geary [19] reviewed 23 replication attempts, finding that only 55% had results consistent with Spencer et al.’s, and that half of these only had so when the researchers controlled for participants’ pre-existing mathematics achievement (an analytic choice not made by Spencer at al.).

Flore and Wicherts [6] pointed out that the lab-based literature on stereotype threat and mathematics has an excess of significant findings (more significant results than one would expect given the average statistical power of published studies). They investigated two possible reasons. First, earlier researchers may have engaged in p-hacking, by using questionable research practices (such as selectively including covariates) to obtain significant effects [20]. Second, the literature may be subject to publication bias, a phenomenon where articles which report significant results are more likely to be accepted for publication than those which do not [18]. Flore and Wicherts’s [6] meta-analysis of 47 lab studies that investigated stereotype threat and mathematics achievement found that publication bias might have “seriously distorted” the meta-analytic effect size estimate they derived from the literature. However, they found that questionable research practices such as p-hacking were not, on their own, sufficient to have created the effect. They left open the possibility that a combination of publication bias and questionable research practices may be present in the literature.

In sum, there is now some doubt about the reliability of the lab-based literature on stereotype threat. While lab studies, on average, report small effects in the same direction as Spencer et al.’s [5] original experiment, it is unclear whether this effect is robust or an artefact of publication bias. If stereotype threat effects cannot be robustly found in well-controlled lab studies, it seems unlikely that they could be found in authentic contexts such as real-world high-stakes tests.

Es bestehen also erhebliche Zweifel und vieles deutet darauf hin, dass es dort nicht mit rechten Dingen zuging bzw die Daten fehlerhaft sein könnten.

Aus den Ergebnissen:

To create our dependent variable we used the standard, and longstanding, JMC scoring system, which awarded 5 points for each correct answer to the first 15 questions, 6 points for each correct answer to the last 10 questions. One point and 2 points were deducted for incorrect answers to questions 15–20 and questions 21–25 respectively subject to a minimum total score of zero. Participants’ scores varied from 0 to 110, and their mean, M = 44.9, SD = 19.7, was slightly higher than the overall average, N = 251,064, M = 38.71, SD = 19.2, t(1168) = 10.7, p < .001, d = 0.312.

Participants’ mean scores, split by answer-sheet version and gender, are shown in Fig 2. As stated in our preregistration, these scores were subjected to a 2 (version) by 2 (gender) between-subjects Analysis of Variance (ANOVA). This revealed a significant main effect of gender, F(1,1165) = 8.410, p = .004, η2 = .007, which reflected that female participants had a higher mean score than male participants, 46.2 versus 42.7, d = 0.177. There was no significant main effect of version, F(1,1165) = 1.586, p = .208, η2 = .001, (means 45.7, 44.0, d = 0.091. Crucially, we did not find the hypothesized version-by-gender interaction effect, F(1, 1165) = 0.525, p = .469, η2 = .000. Indeed, contrary to the prediction of the stereotype threat account, female participants in the gender-first condition had slightly (but non-significantly) higher scores than those in the gender-last condition, 47.3 v 45.0, t(717) = 1.61, p = .108, d = 0.120.

Noch die Grafik dazu:

Stereotype Threat

Wie man sieht schneiden die Frauen sogar in beiden Versionen besser ab als die Männer, in der „Gender First“ Variante sogar noch besser als in der Gender Last Variante.

Hilfsbereit wie ich nun einmal bin schlage ich eine Rettung des Stereotype Threats vor: Es gibt nun anscheinend Stereotype gegen Männer in dem Bereich, anders sind die Ergebnisse nicht zu erklären. Oder das Stereotype ist, dass Mädchen einfach besser in der Schule abschneiden als die Jungs. Schon klappt alles wieder!

14 Gedanken zu “Stereotype threat kann erneut nicht repliziert werden

  1. Spam-Science.

    Irgendwie bringt man „Wissenschaftlern“ nicht mehr bei, was eine Metaebene ist. Alles, was mit subjektivem, sozialem, psychologischem, ökonomischem Kontext usw. von Wissenschaft zu tun hat, müßte viel stärker Thema sein.

    Vergangenheitsbewältigung müßte auch in der Wissenschaft stattfinden.

    Man sieht das ja an diesem irren Konstrukt der Gendersprache gut: Die (herkömmliche) Sprache funktioniert, ist repräsentativ, führt nicht zu Mißverständnissen – wie sollte sie auch? Das ist nun mal der Job von Sprache. Etwaige Mißstände regeln sich von alleine, da die Leute sich ja verständigen wollen. Sprache kann von ihrem Wesen her gar keine Defizite haben.

    Man braucht also keine „Akademiker“, die nun angebliche „Mängel“ und ihre Behebung postulieren.

    Was macht ein richtiger Akademiker da? Er konstruiert eine künstliche Experimentalsituation – und testet dort nicht, ob die Sprache funktioniert, sondern wieviele Männer und Frauen wir uns z.B. beim generischen Maskulinum oder bei Gendersprache vorstellen.

    Diese Ergebnisse bewertet der „Akademiker“ gemäß dem Zeitgeist. Von Subjektivität hat er offenbar im Studium noch nichts gehört. Dann setzt er einfach, daß Sprache die Geschlechter in unserer Imagination repräsentieren müsse. Muß halt so sein. Wir schreiben das so vor.

    Wir haben hier also eine völlig absurde konstruierte Parallelwelt, wo Forscher sich irgendetwas einbilden und anmaßen – wo Forscher völlig unfähig sind, ihre persönlichen Wertungen und Setzungen zu hinterfragen.

    Jetzt haben wir einen Mißstand! Frauen sind Opfer. Ich bin gut. Ich bin akzeptiertes Mitglied der Gesellschaft durch meine Affirmation der herrschenden Moral. Mir tritt niemand in die Eier, weil ich die Gendersprache nicht nach Strich und Faden zerlege.

    Forscher sind eben auch nur Menschen. Und erstaunlich dumme und angepaßte. Man kann schon mit sehr einfachen Mitteln irgendeine wissenschaftliche „Wahrheit“ suggerieren.

    Die Stereotyp-Forschung ist zudem letztlich eine Zwangsneurose. Sie geht letztlich implizit davon aus, daß Gleichberechtigung zu Gleichverteilung führen müsse. Und sie geht davon aus, daß Mädchen so strunzdumm sind, daß sie nicht den Beruf erlernen, den sie gerne möchten, weil da schlümme „Stereotype“ dräuen.

    Alles ein riesiges Helfersyndrom mit impliziten übergriffigen Wertungen und totaler Unentspanntheit. Normale Menschen würden einfach die Zeitläufte walten lassen, statt mit Quoten und ähnlichem Denken einen rein spekulativen Idealzustand herbeizudirigieren.

    Na ja. Wer kann Wissenschaft heutzutage eigentlich noch ernst nehmen? Wissenschaft bedeutet in den Geisteswissenschaften nicht mehr kritisches Denken, sondern Gewissensonanie verbunden mit dem Gebrauch möglichst vieler exotischer Fremdwörter, die man am besten noch selbst kreiert hat. Da hat sich längst ein weltfremdes Labyrinth entwickelt, aus dem die Leute nicht mehr herauskommen.

  2. Wenn ich das richtig verstehe, führen Stereotype zu Verhaltensänderungen und Unwohlsein.
    Wenn ich also tausendmal gesagt bekomme, ich sei als alter weißer Mann böse und unnütz, dann fühle ich mich scheiße, wenn ich auf die Schublade hingewiesen werde, in der ich stecke.

    Die Ursache für mein Unwohlsein ist also nicht meine Existenz, sondern sind die Stereotype.
    Gäbe es die nicht, oder würden sie abgelehnt oder bekämpft, würde ich mich als alter weißer Mann besser fühlen – und ich wüsste, dass ich nicht böse bin, weil ich ja nichts Böses mache oder getan habe.

    Hier kommen Feminismus und seine Benachteiligungsphilosophie ins Spiel. Beides basiert elementar auf Stereotypen. Sie pauschalieren auf Basis des Attributes Geschlecht. Der Feminismus fordert aufgrund behaupteter jahrtausendelanger Benachteiligung von Frauen eine kontinuierliche Wiedergutmachung. Gleichermaßen vermittelt er Frauen durchgängig, sie seien unterdrückt und benachteiligt. Also fühlen sie sich unterdrückt und benachteiligt – und begehren dagegen auf. Sie begehren gegen ihr eigenes Gefühl auf, weil sie es als berechtigt ansehen.
    Es ist ihnen weitgehend egal, ob Jungs und Männer zu Bildungsverlierern werden, keinen eigenen Nachwuchs mehr haben können oder früher sterben. Denn das Stereotyp bezieht sich ja auf die Benachteiligung von Frauen. Und es ist ein Dogma, das keiner Überprüfung standhalten muss.

    Die Konsequenz ist eine virtuelle dauerhafte Unzufriedenheit, die sich aus einer permanenten Fokussierung auf das Geschlecht ergibt.

    Rassismus überlebt sich, wenn die Rasse oder Hautfarbe im täglichen Leben keine Rolle mehr spielt.
    Feminismus überlebt sich, wenn das Geschlecht im täglichen Leben keine Rolle mehr spielt.

    Deswegen ist der einzige Ausweg, sich als Antifeminist und Antirassist aufzustellen, die Kriterien Geschlecht, Hautfarbe oder Herkunft nicht mehr als zentrale Bewertungsmaßstäbe zuzulassen.
    Ohne diese Bewertungsmaßstäbe gibt es keinen Feminismus mehr. Nur noch Menschen.

      • Ja, dadurch dass auf ein unveränderliches Merkmal abgehoben wird, nämlich Geburtsgeschlecht (belegt durch einen sich bildenden Gebärapparat), erfüllt der Feminismus die selben Kriterien wie der Rassismus. Beide führen zu einer Ungleichbehandlung auf Basis dieser angeborenen Umstände.

        Und bei beiden bildet sich eine unterschiedliche Wertigkeit der Subjekte heraus.

        Wenn ein Mann im Krieg fällt, wird es komplett anders bewerten, als wenn eine Frau von ihrem Partner erschossen wird.

        Wenn ein Greis bei uns im Pflegeheim an Corona oder Impfung stirbt, wird es vollkommen anders bewertet, als wenn ein Dunkelhäutiger in Ruanda an den Folgen der Malaria umkommt.

        Da sind Rassismus und Feminismus wesensgleich.

        • Wenn man sich also von dieser Seite nähert, drängt sich die banale Frage auf, warum Rassismus bei uns geächtet wird, Feminismus hingegen zur Staatsdoktrin erhoben ist.
          Da habe ich noch immer keinen plausiblen Grund für gefunden.

          Die feministischen Triebfedern Herrschsucht, Habgier und Missgunst sind zwar stark ausgeprägt. Aber warum akzeptiert und unterstützt der männliche Teil der Bevölkerung den Feminismus so breit?

          • Ja, das wäre ein verständlicher Grund. Und da Frauen das durchaus gekonnt erfühlen, zeigt der Feminismus immer selektiv auf die entsprechenden Bereiche. Zum Beispiel, dass Frauen in Parteien und Politik unterrepräsentiert sind, obwohl sie das nur sind, weil sie in der absoluten Mehrheit keinen Bock auf einen solche anstrengende Scheiß-Arbeit haben. Da würde ich es mir auch lieber zuhause mit Basteln von Wohnzimmerdeko gemütlich machen und den GenderPayGap verurteilen.

            Aber woher stammt diese Matrix, wer hat sie wie aufgebaut, wer sorgt dafür, dass sie immer sauber funktioniert? Wer setzt Männern diese Klischees in die Köpfe, dass die Frauen unterjocht und benachteiligt sind als Gruppe und man ihnen immer und überall helfen muss?
            Der feministisch-pädagogische Komplex mittels der Alleinhoheit über die Prägung des Nachwuchses? Oder steckt das tiefer?

            Spätestens wenn Zofen a la Baerbock und Lambrecht Männer in Schützengräben schicken und ihnen ohne Gegenleistung immer wieder Selbstaufgabe abverlangen, muss doch irgendwann mal der Groschen fallen. Oder wenn Familien aufgelöst werden und Vaterschaft verstaatlicht wird.

            Warum sind Männer in der Mehrheit so untertänig? Wenn es evolutionär/biologisch ist, wäre es ein Armutszeugnis, wenn es erziehungsbedingt ist ebenso.

            Warum lassen sie sich immer wieder vor den Karren spannen und abwerten? Von Mutti, von der Partnerin, vom Feminismus, von den Medien, der Politik. Als würden sie sich selbst als minderwertig ansehen.

          • Mutti hat vom Anbeginn an definiert, was richtig und falsch ist; Mutti hat von Anbeginn an gutes Verhalten belohnt und schlechtes bestraft, und dann versucht der Mann es Mutti ein Leben lang recht zu machen, und was bietet sich da besser an, vermeintliches Unrecht gegen die Frau zu bekämpfen?

          • Und wenn Mutti ihre Tage hatte und mit PMDS aufgeheizt war, dann erzählte sie immer und immer wieder voller Inbrunst die Geschichte von ihrem gefühlten Elend eingebettet in die Mär vom Patriarchat – und dass die Nachbarin einen viel größeren Pool hat. Welcher kleine Junge will da nicht helfen und dafür sein Leben geben?
            Die Kindheit prägt wirklich sehr stark.

            Was aber auch bedeutet, dass sich Väter die Chance zur gleichberechtigten kindlichen Prägung erobern müssen, um dem sexistischen Spuk ein Ende setzen zu können.
            Das wird ein harter Kampf. Denn Mutti hat was zu verlieren; ihre Privilegien. Männer und Kinder können nur noch gewinnen dabei.
            Aber sie müssen halt antreten.

          • „…warum Rassismus bei uns geächtet wird…“

            Wird er das wirklich? Neuerdings wird doch eher antiweißer Rassismus* gepusht. Somit passt es wieder.

            Dass die Malariaopfer keinen interessieren, liegt wohl daran, dass sich unsere Eliten dann am Ende doch sich selbst der Nächste sind und daher nur mit hiesigen Schwarzen, Muslimen etc. empathisch sind, sofern sie aus der Oberschicht kommen. Hinzu kommt wohl auch, dass kaum einer glaubt, die Malaria wirklich wirksam bekämpfen zu können. Der Lockdown wird ja auch nur aus politischen Gründen gepusht und zu dessen Rechtfertigung eignet sich eine weltweit, insbesondere auch bei uns, verbreitete und v.a. neue Krankheit besser. Außerdem wirkt ein Lockdown nicht gegen eine von Insekten übertragene Krankheit.

            *Mit Antisemitismus als Spezialfall und teilweise werden sogar Ostasiaten eingemeindet.

        • Das Kernproblem ist m.E.n. das Weiße Ritter-Syndrom, dieses Impuls-vor-Verstand-Ding, welches da frauenseitig in Politik, Medien und Verwaltung veritabel bespielt wird.

  3. „kann erneut nicht reproduziert werden“ heißt auf Deutsch: „Ist Schwachsinn“. Weil die Theorie ja zunächst mal vernünftig klingt – und dann noch ne empirische Studie dazu – prima.

    Ich hab hier schon die „Prospect Theory“ zitiert, die ebenso vernünftig klingt – und dafür bekam Daniel Kahneman 2002 einen Nobelpreis; sein Co-Autor Amos Tversky war schon tot – und die stellt sich jetzt, 40 Jahre später, auch wenn sie noch so nachvollziehbar klingt, auch zunehmend als „offenbar doch Schwachsinn“ raus. Kahneman & Tversky, beide Psychologen, haben Risikoaversion untersucht, und an einem Convenience Sample (1979, https://www.jstor.org/stable/1914185) „gezeigt“, dass Leute lieber 1/3 Überlebende als 2/3 Tote haben. Und das hat ewig niemand überprüft, weil das halt vernünftig klingt, genauwie die These, dass Mädchen, denen man sagt, dass sie kein Mathe können, denken, sie können kein Mathe.

    Es stimmt aber halt einfach offenbar nicht. Du kannst nicht mehr oder weniger Mathe, vollkommen egal, wer dir was sagt, und Du bist auch nicht hübsch, nur weil Du auf dem Cover von Sports Illustrated bist. Du rauchst auch nicht weniger, egal, wie widerliche Bilder die Leute auf Zigarettenschachteln drucken. Und der restliche Nudging-Quatsch, den die v.a. westlichen Regierungen gerade allesamt veranstalten, seit locker zwei Jahrzehnten, funktioniert halt damit auch nicht.

    Prinzipiell ist das, wenn man da dagegen ist, „gut“. Schlecht ist, dass immer noch zu viele Leute an so einen Quatsch glauben. Und selbst echte Wissenschaftler das glauben – statt es zu *prüfen*. Was nicht so einfach ist, freilich.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden..