Lexikon der Psychologie: Validität
Validität, auch: Gültigkeit, Testgütekriterium, das angibt, in welchem Maße durch einen Test inhaltlich tatsächlich das gemessen wird, was gemessen werden soll: Denkbar wäre es ja, daß ein Test eine hohe Reliabilität besitzt, aber inhaltlich irrelevante Merkmale erfaßt. Wie bei der Ermittlung des Reliabilitätsgrades, gibt es nun auch bei der Ermittlung der Validität verschiedene Vorgehensweisen, um hier zu empirischen Abschätzungen zu gelangen, die zu unterschiedlichen Resultaten führen können: interne Validierung, externe Validierung und Konstruktvalidierung.
1) Bei der internen Validierung wird ein Testfür sich genommen einer näheren Betrachtung unterzogen. Den einfachsten, aber für viele sozialwissenschaftliche Bereiche nicht immer unproblematischen Fall, stellt dabei die sog. Augenscheinvalidität dar. Es wird einfach postuliert, daß die Testitems ihre Validität durch ihre unmittelbare Evidenz erkennen lassen. Ein Beispiel ist etwa, wenn ein Lehrer den Unterrichtsstoff, den er zuvor behandelt hat, durch einen entsprechenden Test abprüft: Es liegt dann auf der Hand, daß die Aufgaben in dem Maße valide sind, wie sie in Inhalt und Formulierung auf den zuvor vermittelten Unterrichtsstoff zurückgehen. Oftmals hilft man sich bei der internen Validierung auch durch ein sog. Expertenrating, d.h. man läßt (“Fach”- oder auch sog. “Alltags”-) “Experten” einschätzen, inwieweit die verwendeten Items tatsächlich das messen, was gemessen werden soll. Der Grad, in dem sich diese “Experten” hinsichtlich der diagnostischen Brauchbarkeit einzelner Testitems einig sind, gilt als ein Validitätskriterium für den gesamten Test. Fraglich ist hier manchmal das “Expertentum”, hinter dem sich dogmatische Schulmeinungen und/oder wissenschaftlich kaschierte Vorurteile verbergen können (Paradigmenwechsel). Eine überprüfbarere Form der internen Validitätsabschätzung stellt die faktorielle Validierung dar, bei der – nach einer Faktorenanalyse – valide Items das für sie postulierte eindimensionale semantische Vorverständnis dadurch bestätigen, daß sie nur auf einem Faktor substantiell laden (“Generalfaktormodell”). Hier wird die enge Verwandtschaft zur Konsistenz-Reliabilität deutlich. Ähnliches leistet die Berechnung der Item-Trennschärfen, d.h. der Korrelationen zwischen den einzelnen Item-Meßwerten und dem Testrohwert: Invalide Items zeichnen sich hierbei durch niedrige oder gar negative Werte aus und sollten aus dem Test entfernt werden.
2) Im Unterschied zur internen Validierung wird bei der externen Validierung ein Test nicht für sich genommen betrachtet, sondern auf sog. Außenkriterien bezogen, von denen man annimmt, daß sie mit dem zu messenden Merkmal mehr oder minder stark zusammenhängen (Kriteriumsvalidität). Gesetzt etwa den Fall, man hätte einen Test zur Erfassung “psychotischer Dispositionen” entworfen: Eine externe Validierung könnte nun so aussehen, daß dieser Test sowohl sog. “psychiatrisch auffälligen Personen” als auch sog. “normalen Personen” vorgegeben und dann überprüft wird, ob sich diese Personengruppen hinsichtlich ihrer Testergebnisse signifikant voneinander unterscheiden (diskriminierende Validität). Bei der prognostischen Validität werden anhand von Testergebnissen Voraussagen gemacht (etwa über den Schulerfolg): In je höherem Maße diese Voraussagen zutreffen, um so valider gilt der Test; die dabei erzielten Resultate sind aber zumeist nicht sonderlich zufriedenstellend. Die bei weitem gängigste Form der Validitätsbestimmung besteht jedoch darin, Korrelationen zu anderen Tests oder manifesten Merkmalen herzustellen, die den Anspruch erheben, ebenfalls Aspekte dessen zu erfassen, was der zu validierende Test erfassen soll: So könnte man beispielsweise das psychosoziale Konstrukt “politischer Konservatismus” mit der sog. “Sonntagsfrage” (“Wen würden Sie wählen, wenn Sonntag Wahl wäre?”), also einem manifesten Merkmal, in Beziehung setzen; zeigt sich hier eine deutliche Präferenz zugunsten “konservativer” politischer Parteien, so könnte dies als eine Validitätsbestätigung angesehen werden. Bei dieser Art der Validitätsbestimmung eines Tests anhand anderer Tests oder manifester Merkmale besteht jedoch immer die Gefahr von sog. Zirkelschlüssen (Tautologien).
Interne und externe Validierungen führen selten zu den gleichen Resultaten: Faktorielle Validierungen unterstützen eher homogene Tests (Tests also, deren Items untereinander hoch korrelieren), externe Validierungen aber eher heterogene Tests (Tests also, deren Items zwar untereinander schwächer, dafür aber mit den Außenkriterien höher korrelieren). Homogene Tests erfassen aufgrund ihrer Homogenität u.U. nur eine Facette dessen, was erfaßt werden soll, während demgegenüber heterogene Tests den komplexen und vielgestaltigen Phänomenen der Sozialwissenschaften, z.B. in der klinischen Diagnostik oder der Berufseignungsdiagnostik, besser gerecht werden.
3) Bei einer Konstruktvalidierung werden nicht nur bivariate Zusammenhänge, sondern manchmal ganze sozialwissenschaftliche Theorien, mindestens aber theoretisch gut begründete komplexe Hypothesen über das (“kausale”) Zueinander latenter sozialwissenschaftlicher Größen zu Validierungszwecken herangezogen. Mittels geeigneter multivariater Analysemodelle wird überprüft, inwieweit diese Theorien oder Hypothesen mit den Daten übereinstimmen oder gegebenenfalls der Modifikation bedürfen. Hierfür eignen sich u.a. die sog. Strukturgleichungsmodelle, die eine gleichzeitige Überprüfung der faktoriellen Validität und der Konstruktvalidität gestatten.
H.Gi.
Literatur
Lienert, G. A. & Raatz, U. (1998). Testaufbau und Testanalyse (6. Aufl.). Weinheim: Beltz.
Campbell, T. D. & Fiske, D. W. (1959). Convergent and diskriminant validation by the multitrait-multimethod matrix. Psychological Bulletin, 56, 91-108.
Cronbach, L. J. & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.