Replikationskrise: Wortwahl verrät die Qualität einer Studie

Replikationskrise: Die Wortwahl verrät etwas über die Qualität einer Studie

Vergleichende Sprachanalysen zeigen: Was Forscherinnen und Forscher selbst von ihrer Arbeit halten, lässt sich an ihrem Schreibstil ablesen.

von Christiane Gelitz

Ein Auge guckt durch die aufgeschlagenen Seiten eines Buches — © Natali_Mis / Getty Images / iStock (Ausschnitt)
Eine Sprachanalyse wirft auch einen Blick hinter die Worte. (Symbolbild)

Wenn psychologische Studien ein zweites Mal durchgeführt werden, kommt nicht immer das gleiche Ergebnis heraus. Methodische Schwächen der Originalstudie sind ein möglicher Grund und ein erster Hinweis darauf, dass sich ein Befund womöglich nicht bestätigen wird. Einer Forschungsgruppe aus den USA und Kanada ist es nun gelungen, solche Warnzeichen auch im Schreibstil zu finden. »Wir vermuten, dass sich in der Wortwahl das intuitive Urteil der Autoren über die Richtigkeit ihrer Studie spiegelt«, schreiben die Wirtschaftswissenschaftlerin Michal Herzenstein von der University of Delaware und ihr Team in »Psychological Science«.

Die Gruppe zog knapp 300 Originalstudien aus der Psychologie und der Verhaltensökonomie heran, die andere Forschende repliziert, das heißt in gleicher Weise erneut durchgeführt und ausgewertet hatten – aber in weniger als der Hälfte der Fälle mit dem gleichen zentralen Ergebnis. Für die Sprachanalyse verwendete das Team eine Software, die als Goldstandard der linguistischen Textanalyse gilt, das »Linguistic Inquiry and Word Count«; außerdem berücksichtigten die Wissenschaftler zum Beispiel Kennzeichen für den Abstraktionsgrad und die Erzählstruktur. Um herauszufinden, ob sich damit der Replikationserfolg vorhersagen lässt, setzten sie Methoden des maschinellen Lernens ein: Sie trainierten ein statistisches Modell mit den Daten von 80 Prozent der Originalstudien und testeten es an den übrigen 20 Prozent. In 70 Prozent der Fälle gelang es ihnen so, allein anhand der linguistischen Merkmale vorherzusagen, ob der zentrale Befund repliziert werden konnte oder nicht.

Als stärkstes positives Indiz erwies sich eine elaborierte und konkrete Sprache, das heißt eine Wortwahl, die auf Informationsreichtum und Detailgenauigkeit schließen lässt. Ein guter Hinweis auf Replizierbarkeit waren auch Mengenangaben und Präpositionen (»von«, »zu«, »in«, »auf«, »an«), Fragewörter sowie vergleichende und differenzierende Wörter (»höher«, »verschieden«, »nicht«, »aber«). In solchen linguistischen Markern zeige sich, wie sorgfältig die Originalautoren zu Werke gingen, so die Deutung der Gruppe.

Originalstudien, deren Ergebnis nicht bestätigt wurde, formulierten hingegen eher vage, abstrakt und zukunftsbezogen. Außerdem wurde häufiger in der Wir-Form geschrieben – womöglich ein Hinweis darauf, dass die Schwächen erkannt und die Verantwortung auf mehrere Schultern verteilt wurde. Weitere negative Anzeichen waren eine Erzählweise, die Spannung herstellt und am Ende auflöst, sowie positive und erfolgsbezogene Formulierungen wie »zeigen«, »stark« und »beste«. Die Gruppe deutet das als Versuch, die Ergebnisse vorteilhaft darzustellen und überzeugender zu wirken, als es die betreffende Studie eigentlich hergibt. Fazit: Mit ihrer Wortwahl verraten die Autorinnen und Autoren, wie überzeugt sie von ihrer eigenen Forschung sind – und ob sie bewusst oder unbewusst versuchen, überzeugend zu wirken.

Gute Zeichen, schlechte Zeichen

Starke linguistische Marker für erfolgreich replizierte Studien (mit Beispielen):

Mengenwörter: jeder, mehr, alle, beide, durchschnittlich
Fragewörter: welche, wann, wer, ob, wie
Hilfsverben: war, ist, sind, sein
Präpositionen: von, in, zu, für, mit, auf
Gewissheit: alle, vollständig, total, genau

Starke linguistische Marker für Studien, deren Befunde nicht bestätigt wurden:

Positive Begriffe: positiv, Wert, größer, stark, unterstützen, wichtig
Pronomen in der ersten Person Plural: wir, uns, unser
Pronomen in der dritten Person Plural: sie, ihnen, sich selbst
Präsentation: sehen, offenbart, gezeigt, zeigt
Zukunftsbezug: dann, wird, könnte, vorhergesagt, erwartet

Bei der Begutachtung von Studien für Fachzeitschriften könnten sich solche Marker als hilfreich erweisen, schreiben Herzenstein und ihr Team. Sie hätten deutlich mehr sprachliche Merkmale untersucht als andere vor ihnen und überdies mögliche Störvariablen wie das Forschungsthema kontrolliert. Doch sie warnen, die Stichprobe von knapp 300 Studien sei noch zu klein und müsse erst an einer größeren Stichprobe repliziert werden.

Hintergrund der Studie ist die so genannte Replikationskrise, die in den 2010er Jahren die Sozialwissenschaften erschütterte. In einer Umfrage gaben rund 70 Prozent der teilnehmenden Forschenden an, dass sie bereits einmal einen Befund anderer Forschungsgruppen nicht replizieren konnten, und rund 50 Prozent räumten ein, dass ihnen das auch schon mit eigenen Ergebnissen passiert war.

Replikationskrise: Die Wortwahl verrät etwas über die Qualität einer Studie

Gute Zeichen, schlechte Zeichen

WEITERLESEN MIT »SPEKTRUM +«

Schreiben Sie uns!

Artikel zum Thema

Linguistik: Ähnliche Ausdrucksweise verbindet

Motivation: Von einer Schwäche zu sprechen, hat Folgen

Literatur: Der verborgene Spannungsbogen von Erzählungen

Wortwahl: Eine gemeinsame Sprache erhält die Freundschaft

Themenkanäle

Sprache und Linguistik

Der digitale Mensch

Glücksforschung

SponsoredPartnerinhalte