[werner.stangl]s arbeitsblätter 

Gütekriterien empirischer Forschung

Quellen:
https://www.stangl-taller.at/
TESTEXPERIMENT/testguetekriterien.html (03-12-17)
http://www.hilbrands.de/studium/
forschungsmethodik/006.htm (00-12-13)

Lienert, Gustav A. (1989). Testaufbau und Testanalyse. München: PsychologieVerlagsUnion.

Mit der Quantifizierung von relevanten Untersuchungsmerkmalen bei Fragebögen, Tests oder Beobachtungen wird in der Forschung das Ziel verfolgt, die Vergleichbarkeit von Daten sicher zu stellen und sie statistischen Auswertungsverfahren im Hinblick auf mögliche Vergleiche und Abhängigkeiten zugänglich zu machen. Mit der Transformation in quantitative Größen wird auch ein Rationalisierungseffekt angestrebt, da auf diese Weise auch umfangreiches Datenmaterial auf seinen Kern reduziert werden kann. Um die hierfür erforderliche Vergleichbarkeit überprüfen zu können, wurden Gütekriterien entwickelt, wobei diese nach gängiger Auslegung um so höher sind, je besser eine Standardisierung von Untersuchungsinhalt, -ablauf und -situation realisiert werden kann.

Nach Lienert (1989) unterscheidet man bei empirischen Untersuchungen Haupt- und Nebengütekriterien. Hauptkriterien sind die Objektivität, die Reliabilität und die Validität, Nebengütekriterien sind die Ökonomie (Wirtschaftlichkeit), Nützlichkeit, Normierung und Vergleichbarkeit von empirischen Untersuchungen. Weist eine Untersuchung diese Gütekriterien nicht auf, fehlen die wissenschaftlich überprüften Grundlagen und notwendigen Kontrolluntersuchungen.

Es wird gerne betont, die Validität gebe es nicht, es gebe vielmehr recht verschiedene Arten von Validitätsbestimmungen. Das ist sicher richtig, aber gemeinsam ist ihnen: Validitäts- oder Gültigkeitsmaße geben den Grad der Genauigkeit an, mit der ein Verfahren misst, was es zu messen vorgibt. Ein Intelligenztest trägt seinen Namen nur dann zu Recht oder ist nur dann valide, wenn er Intelligenzleistungen und nicht in erster Linie etwa das "Sitzfleisch" misst; ein Intelligenztest für Schulanfänger kann kaum valide sein, wenn er Kindern ohne ausreichende Pause 3 oder 4 Stunden lang konzentrierte Arbeit abverlangt. Ein Test muss also inhaltlich "zutreffen"; wie aber will man das bestimmen? Denn es ist lar, dass der Name "Intelligenz" (ebenso wie "Aggressivität", "Angstlichkeit", "Überichstärke" etc.) ein sog. Konstrukt bezeichnet; Konstrukte sind Begriffe, die mehr oder weniger als theoretisch sinnvoll erscheinen; das Bezeichnete kann aber nicht direkt beobachtet, vielmehr nur aus Indikatoren erschlossen werden. Konstrukte gelten im Rahmen der Theoriebildung als nützliche Annahmen.

Im Grunde ist es das alte Problem der "Wahrheit" von Aussagen, das sich im Validitätskonzept versteckt: Sind Behauptungen zutreffend? Hier: Verdient z. B. ein Test, der als "Intelligenztest" verkauft wird, diesen Namen?

Psychologisch wichtiger sind zunächst die "empirischen Validitäten", d. h. die Übereinstimmungs- und Vorhersagevalidität. Die erste prüft man, indem man die Ergebnisse mit Kriteriumswerten korreliert; so könnte man die Validität eines Rechentests für das 3. Schuljahr durch die Korrelation der Testergebnisse mit den Lehrerurteilen (als sog. Außenkriterium) ausdrücken. Eine Vorhersagevalidität zu bestimmen liegt z. B. bei der Konstruktion eines Schulreifetests nahe: Nach der Testerhebung sollte man mindestens bis zum Ende des ersten Schuljahres warten, um dann die Korrelation zwischen Testresultaten und Schulleistungen zu beurteilen. Valide ist der Test, wenn die Korrelation hoch ausfällt.

Die Beispiele machen deutlich, dass die Validitätsbestimmung mit Hilfe eines sog. Außenkriteriums meist fragwürdig ist, denn die Außenkriterien (wie z. B. das Lehrerurteil) sind oft selbst problematisch, d.h., nicht valide zu erfassen. Vor allem bei Intelligenztests wird zur Validierung eines neuen Tests gern ein bereits bewährter Test als Kriterium herangezogen. Grundsätzliche Zweifel sind somit an allen Verfahren zur Validitätsbestimmung angebracht. Eine befriedigende Reduzierung der Expertenwillkür ist nur durch wechselseitige konstruktive Kritik möglich, wie sie im wissenschaftlichen Diskurs üblich ist.

Neben der praktischen Relevanz wissenschaftlicher Forschung - also der prinzipiellen Möglichkeit des gesellschaftlichen Nützlichmachens wissenschaftlicher Erkenntnisse, unter Absehung von den Wertcharakteristika der Zwecke, für die diese eingesetzt werden - wird der Gesichtspunkt der interessenbezogenen Bedeutsamkeit ins Feld geführt. Von bestimmten ethischen und gesellschaftstheoretischen Werten und Zielvorstellungen ausgehend kann die Anwendung/Verwertung wissenschaftlicher Erkenntnisse hinsichtlich ihrer Nützlichkeit für bestimmte Interessen bzw. Interessenten beurteilt werden. Für den human- und sozialwissenschaftlichen Bereich lässt sich dies etwa an der Gegenüberstellung deutlich machen: Dienen Forschungsergebnisse der "Fremdbestimmung" bzw. Manipulation sozialer (Abhängigkeits-) Verhältnisse im Sinne beliebiger (etwa "herrschender") Interessen/Interessenten? Oder erlauben sie eine Selbstaufklärung der Objekte/Subjekte in Bezug auf deren Lebensbedingungen und fördern eine verstärkte Selbstverfügung darüber (Ermöglichung von Selbstreflexion, Selbstentwicklung, Erweiterung von Eigenverfügung über Handlungsmöglichkeiten)? Auch diesem Kriterium ist offensichtlich durch "intentionales Forscherhandeln" - trotz vielerlei ("parteilicher") Bemühungen in den Sozialwissenschaften v.a. der siebziger und achtziger Jahre - nicht oder nur bedingt bzw. nur unter bestimmten Umständen beizukommen.


Inhaltsübersicht Forschungsmethoden der Psychologie und Pädagogik




inhalt :::: nachricht :::: news :::: impressum :::: datenschutz :::: autor :::: copyright :::: zitieren ::::


navigation: