Das Kefk Network Wiki befindet sich im Testbetrieb.
Konditionierung
Aus Kefk.
Unter Konditionierung versteht man in der Psychologie das Erlernen von Reiz-Reaktions-Mustern (Stimulus-Response). Auf einen bestimmten Reiz folgt beim Organismus kontingent eine bestimmte Reaktion. Man unterscheidet zwei Grundtypen der Konditionierung: Die Klassische Konditionierung und die Operante Konditionierung.
Inhaltsverzeichnis |
Klassische Konditionierung
| <imagemap>-Fehler: Bild ist ungültig oder nicht vorhanden | Die Artikel Konditionierung und Klassische Konditionierung überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Die Diskussion über diese Überschneidungen findet hier statt. Bitte äußere dich dort, bevor du den Baustein entfernst. Cjesch 12:11, 26. Dez. 2006 (CET) |
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Konditionierung, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
Diese Lernform wurde erstmals eingehend von Iwan Petrowitsch Pawlow beschrieben (Nobelpreis für Physiologie oder Medizin 1904). Der Mediziner beobachtete eher beiläufig, dass der Hund, mit dem er experimentierte, um näheres über die Speichelsekretion herauszufinden, schon dann Speichel absonderte, wenn er die Schritte der Person hörte, die ihm Futter brachte. Dieser Speichelfluss war nicht zwingend auf den Geruch oder den Anblick des Futters zurückzuführen, sondern musste eine andere Ursache haben. Um dies genauer zu analysieren, ließ Pawlow in einem Versuch zeitgleich mit dem Vorsetzen von Futter einen Glockenton ertönen. Nach einigen Wiederholungen floss der Speichel schon beim Glockenton, obwohl kein Futter gegeben wurde.
Als Pawlow dieses überraschende Phänomen genauer untersuchte, fand er heraus, dass durch die zeitlich unmittelbar aufeinander folgende Darbietung (Kontiguität) des Glockentons (neutraler Reiz) und des Futters (unkonditionierter Reiz, der eine reflexartige Reaktion auslöst) eine Verbindung zwischen diesen hergestellt wurde.
Nach häufiger gemeinsamer Darbietung wurde der vorher neutrale Reiz (= Glockenton) zu einem konditionierten Reiz, der alleine fast dieselbe Reaktion (= Speichelfluss) auslösen kann, wie der unkonditionierte Reiz (= Futter), mit dem er gekoppelt wurde. Aus der unbedingten Reaktion (= Speichelfluss) auf das Futter wurde eine konditionierte Reaktion auf den Glockenton.
Pawlows Ansatz war der erste und grundlegende Ansatz innerhalb der Lerntheorie. Aufgrund dieser beiden Sachverhalte wird die von ihm entwickelte Lerntheorie als Klassisches Konditionieren bezeichnet.
Unbedingter Reiz (= unconditioned stimulus - UCS) ist ein Reiz, der ohne vorangegangenes Lernen eine Reaktion auslöst. Unbedingte Reaktion (= unconditioned response - UCR) ist eine angeborene Reaktion, die durch den UCS ausgelöst wird. Neutraler Reiz (= neutral stimulus - NS) ist ein Reiz, der zu keiner bestimmten Reaktion führt. Bedingter Reiz (= conditioned stimulus - CS) ist ein ursprünglich neutraler Reiz, der aufgrund einer mehrmaligen Kopplung mit einem UCS eine gelernte oder bedingte Reaktion bewirkt. Bedingte Reaktion (= conditioned response - CR) ist eine erlernte Reaktion, die durch den CS ausgelöst wird.
Schema des klassischen Konditionierens am Beispiel des Hundes:
1. Neutraler Reiz (NS) (z.B. Glockenton) => keiner spezifischen Reaktion
2. Unbedingter Reiz (UCS) (z.B. Futter) => Unbedingte Reaktion (UCR) (Speichelfluss) [biologisch signifikant]
3. Lernen: (Reiz-)Kopplung von neutralem Reiz (NS) (z.B. Glockenton) mit unbedingtem Reiz (UCS) (z.B. Futter) => unbedingter Reaktion (UCR) (z.B. Speichelabsonderung)
- Diese Kopplung muss mehrere Male wiederholt werden. Nur durch die Wiederholung setzt der Lernvorgang ein.
4. Bedingter Reiz (CS) (hier: Glockenton) => Bedingte Reaktion (CR) (hier: Speichelabsonderung)
kurzgefasst:
vor Training: NS => keine spezifische Reaktion ; UCS => UCR
Training: NS + UCS => UCR
Ergebnis (= klassische Konditionierung): CS => CR
Der Unterschied zwischen CS und UCS besteht in der Reaktion, die sie vor der Konditionierung auslösen: Der CS darf anfangs von sich aus keine deutliche Reaktion hervorrufen, er muss jedoch eine Orientierungsreaktion (OR) auslösen - dass bedeutet, der Organismus muss dem Reiz Aufmerksamkeit schenken. So ist dieser anfangs ein neutraler Reiz (NS), der noch nichts mit dem Thema zu tun hat. Der UCS hingegen löst eine deutliche Reaktion im Organismus aus. Achtung: UCR und CR müssen nicht die gleiche Phänomenologie aufweisen (wie bei Pawlows Experiment). Ein Beispiel dafür ist Schockkonditionierung beim Menschen: Die UCR ist eine Schreckreaktion, verbunden mit einer Erhöhung von Herzfrequenz und Blutdruck. Testet man nach dem Training die CR, dann besteht diese jedoch in einer Senkung der Herzfrequenz.
mehrmalige Koppelung + Kontiguität: Das Gesetz der Kontiguität (lat. contiguitas = die Angrenzung) besagt, dass eine Konditionierung nur erfolgt, wenn der unbedingte Reiz mehrfach mit dem neutralen Reiz gekoppelt auftritt und wiederholt wird, sowie die Reize zeitlich und räumlich beieinander auftreten.
Reizgeneralisierung : Wenn eine kond. Reaktion auf einen bestimmten Reiz gelernt worden ist, kann es vorkommen, dass ähnliche Reize die gleiche Reaktion auslösen, dabei gilt: je ähnlicher der Neureiz dem kond. Reiz, desto stärker werden die Reaktionen ausfallen.
Siehe auch: Pawlowscher Hund, Klassische Konditionierung
Operante Konditionierung (auch: Instrumentelle Konditionierung)
Bei der operanten oder auch instrumentellen Konditionierung kann ein ursprünglich unbedeutendes Spontanverhalten durch einen positiven/negativen Verstärker bevorzugt/vermieden werden. Die Häufigkeit des Auftretens eines Verhaltens kann also nachhaltig beeinflusst werden.
Ein wichtiges Defizit der Theorie der klassischen Konditionierung ist ihr Unvermögen, das Auftreten neuer Verhaltensweisen befriedigend zu erklären. Eine elegante Methode, auf gleichermaßen anschauliche wie reproduzierbare Weise einem Testtier neue Verhaltensweisen beizubringen, stellt das Lernen mit Hilfe einer so genannten Skinner-Box dar.
Während beim klassischen Konditionieren ein neuer Reiz kennen und verstehen gelernt wird, lernt das Versuchstier beim operanten Konditionieren eine bestimmte Verhaltensweise auszuführen, die auf dem natürlichen Repertoire basieren kann, diesem aber nicht 1:1 entsprechen muss. Durch positive Verstärkung und Methoden wie shaping und chaining wird die Auftretenswahrscheinlichkeit dieses Verhaltens erhöht.
Besonders verdient gemacht in dieser Disziplin hat sich Burrhus Frederic Skinner, der intensiv auf diesem Gebiet forschte.
Das Prinzip ist einfach: wenn das Versuchstier zufällig die erwünschte Handlung ausführt, bekommt es einen positiven Verstärker. Es lernt schnell den Zusammenhang zwischen Handlung und Belohnung. Das heißt, Verstärker sorgen beim operanten Konditionieren dafür, dass das Auftreten einer bestimmten Reaktion begünstigt oder erschwert wird. Aber was ist denn nun ein Verstärker? Das können in den einzelnen Fällen recht unterschiedliche Dinge sein: Für ein kleines Kind reicht da vielleicht schon etwas Schokolade, während bei einem Erwachsenen auch Kopfnicken oder Schulterklopfen Verstärkung genug sein kann (sozialer Verstärker). Was letztendlich als Verstärker funktioniert, bestimmt jedoch die Versuchsperson (also die Person, bei der eine bestimmte Verhaltensweise verstärkt werden soll). Wichtig ist, dass die Verstärker kontingent (also unmittelbar, erkennbar, regelhaft) und motivationsadäquat sind und Bedürfnisse (z.B. Hunger, Aktivitätsbedürfnis) befriedigen. Bei einem Verstärker, der erst Stunden nach der gewünschten Reaktion eintritt, ist nicht mehr erkennbar, wofür er vergeben wurde, und er hat deshalb keine Wirkung. Auch wird eine satte Ratte für eine Futterpille nichts mehr veranstalten - die Bedürfnisspannung fehlt. Um einer Verfettung von Laborratten vorzubeugen, benutzt man in der Forschung Erkenntnisse der Klassischen Konditionierung: Der Reiz "Verstärker" (hier: Futter) wird mit einem anfangs neutralen Reiz (z.B. einem Pfiff) gekoppelt, wodurch der Pfiff durch klassische Konditionierung zum bedingten Reiz wird, der dann - wie Futter - ebenfalls die Wirkung einer Belohnung hat (diskriminativer Hinweisreiz). Um einer Extinktion vorzubeugen, muss die Kopplung gelegentlich wiederholt werden.
Das Kontingenzschema: positive und negative Verstärkung, Bestrafung I und II
Verstärkung ist jener Prozess, der dazu führt, dass ein spontan gezeigtes Verhalten vermehrt auftritt. Als Verstärker werden jene Verhaltenskonsequenzen bezeichnet, die die Wahrscheinlichkeit erhöhen, dass das Verhalten wiederholt gezeigt wird. Man unterscheidet die Verstärker nach ihrer Wirkung. Gerade negative Verstärker und Bestrafung werden häufig miteinander verwechselt. Daher folgt zunächst eine Definition:
Positive Verstärkung bedeutet die Erhöhung der Auftretenswahrscheinlichkeit eines Verhaltens, wenn als Reiz ein positiver Verstärker hinzutritt. Beispiele für positive Verstärker sind Anerkennung, Achtung, Nahrung, Geld.
Negative Verstärkung bedeutet die Erhöhung der Auftretenswahrscheinlichkeit eines Verhaltens, wenn als Reiz ein negativer Verstärker entfernt wird. Negative Verstärker sind z. B. (jeweils das Entfernen von) Lärm, grelles Licht, Hitze oder Kälte, Stromschlag.
Bestrafung bedeutet die Reduzierung der Auftretenswahrscheinlichkeit eines Verhaltens. Wichtig ist dabei, dass es nicht zwingend einen "Bestrafer" geben muss, sondern Bestrafung bezeichnet alle Verhaltenskontingenzen, welche die Auftretenswahrscheinlichkeit eines Verhaltens reduzieren.
Bestrafung I bedeutet, dass ein spezifisches Verhalten einen aversiven Reiz zur Folge hat, der die Auftretenswahrscheinlichkeit dieses Verhaltens senkt. Beispiele hierfür sind Lärm, grelles Licht, Hitze oder Kälte, Stromschlag.
Bestrafung II - auch omission training genannt - bedeutet, dass ein spezifisches Verhalten zur Folge hat, dass ein positiver Reiz entfernt wird. Dadurch wird die Auftretenswahrscheinlichkeit dieses Verhaltens gesenkt. Ein Beispiel hierfür ist,wenn ein Kind einen Trotzanfall bekommt und ihm die Eltern daraufhin das liebste Spielzeug wegnehmen.
In Analogie zu positiver und negativer Verstärkung wird zuweilen Bestrafung I auch als "positive Bestrafung" bezeichnet und Bestrafung II als "negative Bestrafung".
Diese Arten der Beeinflussung von Reaktionen können in folgender Tabelle festgehalten werden.
| ... der Reizsituation | ||
| hinzufügen: | entfernen: | |
| positive Konsequenz ... | positive Verstärkung | Bestrafung II |
| negative Konsequenz ... | Bestrafung I | negative Verstärkung |
Wichtig ist hierbei, dass die Bezeichnung positive, bzw. negative Konsequenz sehr schwammig ist. Die Definition von Verstärkern ist nur anhand von Beispielen möglich. Im Behaviorismus sind Begrifflichkeiten wie "angenehm" eher unpassend, da sie subjektiv sind. Dieser Fehler wird leider auch von vielen Lehrbüchern und Lexika begangen.
Arten von Verstärkern
- Primäre und sekundäre Verstärker
- Man unterscheidet verschiedene Arten von Verstärkern. Zwei klassische Arten sind: primäre Verstärker und sekundäre Verstärker. Primäre Verstärker sind jene Verstärker, die bereits von Geburt an wirken. Laut Miller und Dollard wirkt jede Reduktion eines allzu intensiven Reizes als primäre Verstärkung. Primäre Verstärker sind beispielsweise Essen und Trinken, da sie Hunger und Durst reduzieren, aber auch Körperkontakt ist primärer Verstärker. Sekundäre Verstärker dagegen sind gelernte Verstärker. Sie sind also zunächst neutrale Reize, die durch die wiederholte Koppelung mit primären Verstärkern sekundäre Verstärkerqualität erhalten. Beispiele für sekundäre Verstärker sind beispielsweise Geld, denn die Funktion wird erst gelernt. Zunächst ist Geld ein komplett neutraler Reiz, bis gelernt wird, dass es zur Bedürfnisbefriedigung herangezogen werden kann.
- Premack-Prinzip
- Ferner hat sich gezeigt, dass bereits antizipiertes Verhalten als Verstärker dienen kann. Verhalten, das wir gerne und häufig tun, hat eine verstärkende Wirkung. Wird uns nach den Hausaufgaben etwa ein Kinobesuch versprochen, so wird die Auftretenswahrscheinlichkeit der Handlung, dass die Hausaufgaben gemacht werden, erhöht. Das Premack-Prinzip besagt, dass ein Verhalten, das unter natürlichen Bedingungen mit einer höheren Häufigkeit gezeigt wird, als Verstärker für ein Verhalten dienen kann, das unter natürlichen Bedingungen mit einer geringeren Häufigkeit gezeigt wird. Nehmen wir als Beispiel ein Kind: Wenn wir es vollkommen frei vor die Wahl zwischen den beiden Verhalten "Fernsehen schauen" und "Zimmer aufräumen" stellen, wird es sich mutmaßlich für ersteres entscheiden. Nun können wir das Verhalten mit der höheren Auftretenswahrscheinlichkeit als Verstärker benutzen: Dem Kind wird erst erlaubt, Fernsehen zu schauen, wenn es sein Zimmer aufgeräumt hat.
Es gibt jedoch Einschränkungen in der Gültigkeit des Premack-Prinzips. So hat man in Tierversuchen mit Ratten nachgewiesen, dass auch ein Verhalten, dass eine niedrigere Auftretenswahrscheinlichkeit besitzt, als Verstärker dienen kann: Nehmen wir an, eine Ratte, die eine Stunde in einem Käfig sitzt, verbringt ohne äußere Zwänge 50 Minuten damit, an einem Wasserspender zu lecken und zehn Minuten damit, in einem Laufrad zu rennen. Man kann nun nach dem Premack-Prinzip ohne Probleme das längere Rennen im Laufrad durch das Lecken verstärken. Es geht jedoch auch anders herum. Wenn die Ratte zwei Minuten lecken muss, um danach eine Minute im Laufrad zu rennen, wird dies nicht als Verstärker wirken, da die Ratte nach diesem Verstärkerplan 'locker' auf ihre Basisverhaltenhäufigkeit von 10 Minuten Rennen in der Stunde kommt. Wenn die Ratte aber fünfzehn Minuten lecken muss, um eine Minute rennen zu dürfen, wirkt dieses Verhalten als Verstärkung für das Lecken. Somit kann, entgegen dem Premack-Prinzip, auch ein Verhalten mit einer niedrigeren Auftretenshäufigkeit als Verstärker dienen.
Verstärkungspläne
Nicht immer führt eine sofortige Verstärkung nach der gewünschten Reaktion zum gewünschten Ziel. So haben sich Verstärkerpläne herauskristallisiert, die zu unterschiedlichen Konsequenzen führen, was das Lernen und insbesondere auch Vergessen (Extinktion) betrifft. Die verschiedenen Varianten sollen kurz vorgestellt werden.
- Kontinuierliche Verstärkung (CRF)
- Hier wird bei jeder gewünschten Reaktion verstärkt. Dies führt zu einem starken Anstieg der Lernkurve. Die Versuchsperson lernt also schnell, vergisst aber auch ebenso schnell wieder.
- Intermittierende Verstärkung (VR, VI, FR, FI)
- Hierbei wird nicht jede gewünschte Reaktion verstärkt, sondern etwa jede zweite, dritte usw. Zwar steigt hier die Lernkurve erwartungsgemäß nicht so stark an, jedoch fällt danach die "Vergessenskurve" auch weniger stark ab: Der Extinktionsgrad ist geringer, man vergisst also nicht so schnell.
- Intervallverstärkung (FI, VI)
- Bei dieser Methode wird in einem konstanten oder variablen Zeitintervall verstärkt, sofern das erwünschte Verhalten auftritt.
- Quotenverstärkung (FR, VR)
- Bei dieser Variante verstärkt man erst, wenn eine bestimmte Anzahl von gewünschten Reaktionen erfolgt ist.
- Fixierte und variable Pläne
- Intervall- und Quotenpläne gibt es fixiert und variabel. Bei einem fixierten Quotenplan wird beispielsweise exakt jede fünfte Reaktion verstärkt, bei einem variablen Quotenplan durchschnittlich jede fünfte Reaktion. Letzteres hat den Vorteil größerer Löschungsresistenz.
praktische Anwendung
- Token-Konditionierung
- Ähnlich zu sekundären Verstärkern, gibt es das Prinzip, für eine Verstärkung so genannte Token zu vergeben. Diese können dann später - nach ausreichender Akkumulation von Token - gegen andere Dinge, Handlungen, Dienstleistungen usw. eingetauscht werden. Häufig findet das Prinzip bei der Verhaltensformung Anwendung, wenn in therapeutischen Einrichtungen das Verhalten der Patienten in einer bestimmten Art und Weise geformt werden soll.
- Shaping
- Eine weitere Variante, auf die Verstärkung Einfluss zu nehmen, ist das Shaping (es wird auch shaping oder Approximation genannt). Hier wird nicht erst die komplette Handlung verstärkt, sondern bereits jede Annäherung an eine gewünschte Handlung. Soll eine Taube etwa auf einen roten Punkt auf einer ovalen Scheibe picken, so wird bereits verstärkt, wenn die Taube den Kopf zur Scheibe bewegt; dann, wenn sie zur Scheibe schaut; dann, wenn sie sich der Scheibe nähert; dann, wenn sie auf die Scheibe pickt und schließlich, wenn sie den roten Punkt auf der Scheibe trifft. Insbesondere dient diese Technik der Erlernung komplexerer Handlungsweisen. Auf diese Weise können auch recht unnatürliche Handlungsweisen bei Tieren konditioniert werden, wie sie etwa im Zirkus zu sehen sind.
Kritik
Sowohl das klassische Konditionieren als auch das operante Konditionieren gehen von einem recht mechanischen Menschenbild aus. Ihre Begründer waren Behavioristen, die den Menschen als Black-Box sahen und ihre Forschungsergebnisse auf Regeln mit mathematischer Präzision zurückführen wollten. Dieses Menschenbild geht jedoch in einem ungenügenden Maße auf die selbständigen Prozesse innerhalb des Menschen ein, so dass sich viele Verhaltensweisen nicht mit diesen Regeln erklären ließen. Dazu zählt die selbständige Verstärkung des Menschen sowie das Lernen ohne die Bildung einer Reaktion. Erst mit der Betrachtung alternativer Modelle - etwa Albert Banduras sozialkognitiver Lerntheorie, welche sich insbesondere auf das Beobachtungslernen oder Modelllernen bezieht - wurden auch diese Verhaltensmuster erklärbar.
Auch aus ethischer Sicht gibt es Kritik: Die erzieherischen Konsequenzen des Behaviorismus werden als problematisch angesehen, sofern sie in einer Weise eingesetzt werden, die an Dressur und Gehirnwäsche erinnert. Die operante und klassische Konditionierung sollte in einer ethisch vertretbaren Weise eingesetzt werden, wozu die willentliche Partizipation des Lernenden am Konditionierungsprozess nach einer transparenten Offenlegung gehört.
Weblinks
Siehe auch
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Konditionierung, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
