[werner.stangl]s arbeitsblätter 

Operante und instrumentelle Konditionierung - Die behavioristischen Ansätze

Siehe dazu auch

Das klassische Konditionieren kann eine Reihe von Lernphänomenen nicht erklären. Dazu gehören insbesondere

Skinner, der wichtigste Vertreter des operanten Konditionierens unterscheidet zwei Typen der Konditionierung:

Das operante Konditionieren besteht in der Beeinflussung der Auftretenswahrscheinlichkeit operanten Verhaltens durch bestimmte Verhaltenskonsequenzen. Operantes Lernen kann auch als Lernen neuer Verhaltens-Folge-Beziehungen verstanden werden. Unter Operantem Konditionieren versteht man auch das Lernen durch Versuch und Irrtum. Es läßt keine unmittelbaren Auslöser erkennen, bewirkt aber eine Reaktion in der Umwelt. Es wird durch seine Folgen gesteuert.

Das Grundprinzip ist das Bekräftigungslernen. Durch die planmäßige Gestaltung der Folgen einer Handlung wird die Auftretenswahrscheinlichkeit des Verhaltens verändert. Je nach Art der Folgen erhöht oder erniedrigt sich diese. Verstärker sind kontingent auftretende Folgen.

Es gibt drei wichtige Schritte:

Auch beim operanten Konditionieren kann eine Stimuluskontrolle vorhanden sein. Z.B. kann die Handlung ausgelöst werden im Beisein bestimmter Stimuli und bei anderen Stimuli wird sie nicht ausgeführt. Die Stimuli haben daher nur Hinweisfunktion.

Thorndike formulierte das "Gesetz der Wirkung", das den Begriff "Lernen am Erfolg" beinhaltet. Zufällige Aktionen, die zu einer positiven Konsequenz für das Individuum führen, werden seiner Meinung nach selektiert und öfter eingesetzt. Für ihn war die Verknüpfung von Reiz und Reaktion, nicht einfach nur durch Wiederholung und Kontiguität vorhanden, sondern ebenfalls an eine Verstärkung gebunden. Diese Verstärkung bezieht sich auf die subjektive Wahrnehmung des Lernenden. Wenn die Verknüpfung von Reiz und Reaktion einen Zustand der Befriedigung (verstärkender Effekt) für das Individuum darstellt, wird die Verknüpfung gestärkt. Im Gegensatz dazu zieht der Effekt einer Nichtbefriedigung eine Schwächung der Verknüpfung nach sich.

 

Burrhus Frederic Skinner führte in den USA Tierversuche mit Tauben und Ratten durch. Auch dazu wurde eine künstliche Experimentalsituation entwickelt, die Skinner-Box:

Skinner-Box Operante und instrumentelle Konditionierung

Siehe dazu im Detail

Operante Konditionierung bei Skinner

Das Konzept der Verstärkung und der Bestrafung

Unter einem Verstärker versteht man jeden dem Verhalten folgenden Stimulus, der die Verhaltenshäufigkeit steigert. Bei der Bestrafung verhält es sich umgekehrt: Unter einer Bestrafung versteht man jeden dem Verhalten folgenden Stimulus, der die Verhaltenshäufigkeit mindert. Auch Verhaltensweisen können als Verstärker bzw. Bestrafung fungieren.

Primäre Verstärker/Bestrafung hängen mit biologischen Bedürfnissen zusammen (z.B. Futter, E-Schock). Sekundäre Verstärker entstehen durch Koppelung (z.B. durch klassische Konditionierung!) mit primären Verstärkern (z.B. zu Essen geben + Lächeln). Sekundäre bzw. soziale Verstärker (z.B. Geld, soziale Anerkennung) spielen eine größere Rolle als primäre Verstärker. In vielen Fällen führen sie zu primärer Verstärkung oder können gegen eine solche eingetauscht werden. Sekundäre Verstärker sind leichter und unmittelbarer einsetzbar.

Wesentlich für die Verstärkung ist die Kontingenz, d.h. es muß eine Korrelation zwischen Verhalten und Verstärker bestehen. Es darf keine Verstärkung erfolgen, wenn das Verhalten nicht auftritt!

Es gibt 4 Arten von Verstärkung und Bestrafung:

Auch beim klassischen Konditionieren kann man von Verstärkung sprechen. Der Verstärker beim operanten entspricht dem UCS beim klassischen.

Diskriminative Stimuli

Auch beim operanten Lernen können Reize eine Rolle spielen, die dem Verhalten vorausgehen. Diese Reize können anzeigen, ob einem bestimmten Verhalten eine bestimmte Verstärkung folgen wird (positiver diskriminativer Reiz) oder nicht (negativer diskriminativer Reiz). Wenn ein bestimmtes Verhalten von diskriminativen Reizen beeinflusst wird, dann ist das Verhalten unter "Stimuluskontrolle". Experimentell kann man das so erzeugen, dass man ein Versuchstier z.B. nur dann für das Drücken eines Hebels belohnt, wenn vorher ein Licht aufleuchtet. Äußerlich kann dann beobachtet werden, dass das Licht das Hebeldrücken offenbar auslöst. In Wirklichkeit führt das Licht jedoch dazu, dass in dieser Situation für das Hebeldrücken eine Belohnung erwartet wird. Die diskriminativen Reize rufen das Verhalten also nicht hervor. Sie haben lediglich einen Informationswert bezüglich zu erwartender Verstärkungen.

Es gibt im Alltag viele Beispiele für Verhalten, das unter Stimuluskontrolle ist (z.B. der Anblick einer Zigarettenschachtel scheint oft unmittelbar den Griff zur Zigarette auszulösen, tatsächlich führt der Anblick jedoch zu der Erwartung eines belohnenden Ereignisses wenn der Griff zur Zigarette bzw. das Rauchen der Zigarette erfolgt).

Im Rahmen seiner Untersuchungen hat Skinner verschiedene "Verstärkungspläne" erarbeitet:

  1. Für die Erhaltung des gewünschten Verhaltens ist eine konsequente Reaktion auf das gezeigte Verhalten nötig (Lob, Strafe etc.)
  2. Wird die Konsequenz nur sporadisch (bzw. partiell) ignoriert, verstärkt sie u.U. das unerwünschte Verhalten.
  3. Wird das gezeigte Verhalten ignoriert, führt dies zur dessen Extinktion (Ko)
  4. Wenn der Operand sein Verhalten stabilisiert hat, kann man zu einer partiellen Verstärkung übergehen (dann ist die Gefahr der Löschung gering)

Weiterhin ist wie auch bei Pawlow eine Kontiguität zwischen dem gezeigten Verhalten und der Konsequenz notwendig. Das Kind muß z.B. erkennen können, dass die Strafe sich auf ein spezifisches unerwünschtes Verhalten bezieht. Wenn dem nicht so ist, wächst die Gefahr einer Generalisierung.

 

Typischer Verlauf einer Konditionierung

 

Weitere Grundbegriffe des operanten Konditionierens

Vermeidung

Bei dem Vermeidungstraining erhält ein Organismus einen aversiven Reiz, wenn er eine bestimmte Reaktion nicht ausführt.

Extinktion von Vermeidungsantworten

Positive Verstärkung

Wenn ein Organismus ein Verhalten zeigt und darauf hin eine angenehme Antwort folgt, so wird dieses Verhaltens öfters gezeigt.

Negative Verstärkung

Nach Ausführen eines Verhaltens sinkt die Wahrscheinlichkeit für das Auftreten einer aversiven Antwort.

Das Modell des operanten Konditionierens kennt drei Verlernenmechanismen:

 

 

Weitere Quellen
https://www.stangl-taller.at/TESTEXPERIMENT/experimentbspconditioning.html (01-01-22)
http://www.uni-bielefeld.de/idm/personen/shorsman/lerntheorie.html (01-01-22)
http://www.psychologie.uni-bielefeld.de/ae/AE12/LEHRE/Lernen.htm (01-01-22)
Edelmann, W. (1995). Lernpsychologie. Weinheim: Psychologie-Verlags-Union.

 



inhalt :::: nachricht :::: news :::: impressum :::: datenschutz :::: autor :::: copyright :::: zitieren ::::


navigation: