Lexikon der Mathematik: Psychometrie
Wissenschaft, deren Gegenstand mathematische und statistische Modelle zur Beschreibung und Analyse von Merkmalen und Prozessen im Rahmen der Psychologie, aber auch bestimmter Bereiche der Sozial- und Naturwissenschaften sind. Zu den zentralen Gebieten der Psychometrie zählen abgesehen von der Statistik die Meß- und Testtheorie.
Aufgabe der Meßtheorie ist die Erstellung von Axiomensystemen für die Meßbarkeit von Merkmalen. Messung wird als eine homomorphe Abbildung, sogenannte Skala, eines empirischen Relativs in ein numerisches Relativ definiert.
Nach dem Grad der Eindeutigkeit der Homomorphismen werden unterschiedliche Skalenarten unterschieden. Die allgemeinste Klasse zulässiger Transformationen enthält alle injektiven Abbildungen und definiert die Skala mit dem niedrigsten Skalenniveau, die sogenannte Nominalskala (Bsp.: Feststellung des Geschlechts mit männlich ↦ 1 und weiblich ↦ 2). Streng monotone Transformationen definieren die Ordinalskala (Bsp.: Schulnoten, Mohssche Härteskala). Positiv affine Transformationen kennzeichnen die Intervallskala (Bsp.: Celsiusskala, Intelligenzquotient), während Ratioskalen (z. B. zur Messung des elektrischen Hautwiderstands oder von Reaktionszeiten) lediglich Ähnlichkeitstransformationen der Art f (x) = αx mit α > 0 zulassen. (Siehe auch Skalentypen).
Neben solchen Meßstrukturen für eindimensionale Merkmale wurden innerhalb der Meßtheorie zahlreiche Axiomensysteme für mehrdimensionale Merkmale entwickelt, z. B. additiv oder polynomisch verbundene Strukturen.
Die (psychologische) Testtheorie thematisiert Modelle zur Konstruktion von Testverfahren, z. B. Persönlichkeits- oder Leistungstests. Hier werden insbesondere zwei unterschiedliche Ansätze unterschieden, die klassische Testtheorie und die Item-Response-Theory (IRT).
Die klassische Testtheorie geht von beobachteten Meßwerten X aus, z. B. Zahl der richtigen Antworten in einem Intelligenztest, die als Summe aus einem wahren Wert τ und einem davon unabhängigen Meßfehler ϵ aufgefaßt werden. Die Genauigkeit der Messung, die Reliabilität, wird durch das Verhältnis der Varianz von τ zur Varianz von X definiert, während die Gültigkeit eines Meßwertes als Korrelation von X mit einem Außenkriterium (Kriteriumsvalidität) bestimmt wird.
Restriktive Voraussetzungen, die in der klassischen Testtheorie z. B. zur Schätzung der Varianzen der wahren Werte benötigt werden, haben u. a. dazu geführt, daß zunehmend IRT-Modelle eingesetzt werden, die darüber hinaus den Anforderungen computergestützter adaptiver Testverfahren gerechter werden.
Ausgangspunkt der IRT-Modelle ist die Wahrscheinlichkeit P(Yi = 1 | ϑj) dafür, daß ein Proband mit Fähigkeit ϑj das Item Yi korrekt beantwortet. Sehr häufig wird das so genannte dreiparametrige logistische Modell oder eine Spezifikation davon angewendet:
wobei γi die Ratewahrscheinlichkeit für die richtige Antwort, αi die Trennschärfe, βi die Schwierigkeit des Items Yi und F die logistische Verteilungsfunktion repräsentieren. Ohne den Rateparameter γ resultiert das zweiparametrige logistische Modell, das auch Birnbaum-Modell genannt wird. Werden weiterhin die Trennschärfen für alle Items gleich 1 gesetzt, liegt das Rasch-Modell vor. Dieses Modell zeichnet sich durch die sogenannte spezifische Objektivität aus, d. h. die Summe der korrekten Antworten bildet unabhängig von den Itemschwierigkeiten eine suffiziente Statistik für den Fähigkeitsparameter ϑ. Ist eine Menge von Items Raschskalierbar, werden somit die Fähigkeitsausprägungen von Personen unabhängig von den konkret ausgewählten Items geschätzt.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.