Lexikon der Biologie: Lernen
ESSAY
Rüdiger Vaas
Lernen
Lernen ist das Speichern von individuell und selektiv erworbenen Informationen aus der Umwelt im Gedächtnis in abrufbarer Form. Es zeigt sich in einem mehr oder weniger lange anhaltenden, veränderten Verhalten – abhängig von früheren Erfahrungen. Lernen basiert auf einer spezifischen Verstärkung der Verknüpfung bestimmter Nervenzellen im Zentralnervensystem, und zwar einer erleichterten Signalübertragung an den Synapsen durch biochemische (Hebbsche Regel) und strukturelle Modifikationen (Langzeitpotenzierung, synaptische Plastizität). Details dieser Vorgänge sind bei unterschiedlichen Organismen zwar verschieden, auf der molekularen und cytologischen Ebene besteht jedoch große Einheitlichkeit. Lernen ist sowohl ein Prozeß (Informationsaufnahme, -verarbeitung und -speicherung) als auch ein Produkt (die Disposition, künftiges Verhalten an den gemachten Erfahrungen zu orientieren und eventuell zu modifizieren oder zu unterlassen). Dies ermöglicht eine flexiblere Reaktion auf Umweltreize und -veränderungen (Adaptation) sowie eine aktive Einflußnahme – sowohl in der Individualgeschichte als auch im Lauf der Evolution. Der Abruf der gelernten Informationen wird auch als Leistung (Performance) bezeichnet. Lernen steht im Kontrast zu einer Reifung des Verhaltens, das durch Änderungen von Organen oder der inneren (z.B. hormonellen) und äußeren Bedingungen determiniert ist.
Es wird unterschieden zwischen dem obligatorischen Lernen, das zur Ausbildung arttypischer Verhaltensmerkmale (artspezifisches Verhalten) nötig ist (z.B. die Sexualprägung bei vielen Vögeln), und dem fakultativen Lernen, das abhängig von den Randbedingungen fallweise auftritt (z.B. das Erkennen des eigenen Geschlechtspartners). Angeborene Dispositionen (Lerndisposition) stehen nicht im völligen Gegensatz zum Lernen bzw. dem Einfluß der Umwelt, sondern sind deren Voraussetzung. Bei Höheren Säugetieren werden die Möglichkeiten des Lernens durch Spiel-, Erkundungs- und Neugierverhalten (Erkundungsverhalten) insbesondere vor der Adoleszenz gefördert. Besonders beim Spielen werden Verhaltensweisen eingeübt, die erst viel später relevant und realisiert werden (latentes Lernen).
Lernen wurde zunächst als Ausbildung von Reiz-Reaktions-Verbindungen beschrieben. Später wurden auch positive und negative Auswirkungen des Verhaltens und deren Rückwirkung auf künftiges Verhalten berücksichtigt, also ein Lernen am Erfolg (Thorndike, E.L.) bzw. instrumentelles Lernen (Skinner, B.F.). Im Rahmen der kognitiven Lerntheorien wurden in der zweiten Hälfte des 20. Jahrhunderts neben den äußeren Bedingungen auch die inneren Repräsentationen der Umwelt sowie weitere kognitive Operationen berücksichtigt, d.h. Wahrnehmung, Denken, Vorstellung, Sprache, Bewußtsein, Einsicht usw. (Kognition). Es gibt verschiedene, unterschiedlich komplexe Formen des Lernens.
Einfache Formen des Lernens
1) Prägung ist ein artspezifisch bedeutsamer Informationserwerb während einer sensiblen Entwicklungsphase (sensible Phase). Er bedingt irreversible Reaktionen, die z.B. das Individuum befähigen, sehr ähnliche Merkmalsgestaltungen dauerhaft wiederzuerkennen und darauf mit gleichartigem Verhalten zu reagieren. Grundlage für Prägungsvorgänge ist die Ausbildung fester neuronaler Verschaltungen im noch nicht ausgereiften Gehirn (Plastizität im Nervensystem).
2) Habituation (Gewöhnung, Ermüdung, negatives Lernen, afferente Drosselung) besteht im langsamen Nachlassen einer durch einen unbedingten Reiz ausgelösten Reaktion. Bei dieser einfachsten Form des Lernens können harmlose, stereotype Reize ohne Neuigkeitswert ignoriert werden. Habituation führt auf zellulärer Ebene zu einer verringerten Effektivität synaptischer Verbindungen: Die Aktionspotentiale in den sensorischen Neuronen setzen aufgrund eines reduzierten präsynaptischen Calcium-Einstroms (Calcium) immer weniger Neurotransmitter frei, so daß das synaptische Potential der nachgeschalteten Zelle, ein Maß für die synaptische Stärke, abnimmt.
3) Sensitivierung (Sensibilisierung) besteht in einer Verstärkung der Reaktion auf stereotype schädliche oder bedrohliche, aber auch auf viele andere, neutrale Reize. Dadurch kann z.B. die Alarmbereitschaft gegenüber Gefahrenquellen erhöht werden. Die Sensitivierung ist komplexer als die Habituation und kann diese auch außer Kraft setzen (Dishabituation, Extinktion). Bei der Sensitivierung können Synapsen, die bei der Habituation geschwächt werden, in ihrer Effektivität verstärkt werden. Dabei werden erregende Interneurone dazu veranlaßt, die Transmitterausschüttung sensorischer Neuronen zu erhöhen (Kurzzeitverstärkung). Dies geschieht auf verschiedene Weise, z.B. durch eine Aktivierung von Proteinkinasen A (die den präsynaptischen Kalium-Einstrom verringern und den Calcium-Einstrom erhöhen; cAMP-abhängige Proteinkinase), Proteinkinasen C sowie Interaktionen mit mitogenaktivierten Proteinkinasen. Die Langzeitverstärkung wirkt über mehrere Tage und länger. Sie beruht auf der Aktivierung von Genen, der Synthese neuer Proteine und der Ausbildung neuer Synapsen. Langzeithabituation führt dagegen zum Verlust (engl. pruning) von Synapsen, pro Neuron um bis zu einem Drittel.
Assoziatives Lernen
4) Klassische Konditionierung (Signallernen, reaktives Lernen, Reiz-Reaktions-Lernen) nach I.P. Pawlow besteht im Gegensatz zur Habituation und Sensitivierung, bei der das Individuum nur etwas über die Eigenschaften eines einzigen Reizes lernt, in der Verknüpfung zweier Reize (Assoziation). Dabei wird ein zunächst neutraler, d.h. konditionierter oder bedingter Reiz (Stimulus), z.B. ein Glockenton ( Lernen ), mit einem zweiten, einige Zeit lang regelmäßig nachfolgenden natürlichen, d.h. unkonditionierten oder unbedingten Reiz assoziiert, der eine bedingte Reaktion auslöst (die ein bedingter Reflex sein kann, z.B. ein angeborener Schutzmechanismus wie der Lidschlußreflex [Lidschlußreaktion], aber nicht sein muß). Je nach Versuchsbedingungen (z.B. Tonhöhen, differentielle Belohnungen) geht die Konditionierung mit einer Reiz-Generalisierung oder einer Reiz-Differenzierung (Diskrimination) einher. Die wiederholte Assoziation heißt Bekräftigung (zuweilen auch Verstärkung). Bleibt der unbedingte Reiz längere Zeit aus, verschwindet die bedingte Reaktion wieder (Löschung, Extinktion). Inzwischen ist der streng behavioristische Ansatz (Behaviorismus) insofern erweitert worden, als unter Reizen nicht mehr nur physiko-chemische Außenweltereignisse, sondern auch Vorstellungen verstanden werden, und Reaktionen nicht nur ein Verhalten, sondern auch ein inneres Erleben umfassen. So kann z.B. schon die Vorstellung einer (zuvor erfahrenen) Gefahr Angst auslösen. Die neuronalen Mechanismen der Konditionierung sind bereits recht gut verstanden ( vgl. Infobox 1 ). Als paradigmatisch hat sich bei Säugetieren die Langzeitpotenzierung erwiesen.
5) Instrumentelles Lernen (operantes Lernen, Lernen durch Versuch und Irrtum) besteht in der Assoziation bestimmter Reize mit einer Reaktion, d.h. einem instrumentellen Verhalten, dessen Auswirkungen (Konsequenzen) die Wahrscheinlichkeit seines künftigen Auftretens bestimmen ( vgl. Tab. ). Das Verhalten ist also ein Mittel (Instrument), das eine bestimmte Konsequenz hervorruft. Bei einfachen, bereitschaftsabhängigen assoziativen Lernformen ( vgl. Infobox 2 ) wird entweder eine neue Wahrnehmung mit einer Handlung (Aktion) verknüpft, weil der Wahrnehmung positive oder negative Erfahrungen folgen (bedingte Appetenz, bedingte Aversion), oder eine bestehende Handlungs-Bereitschaft führt zu einem neuen Verhalten, weil dieses belohnt wurde (bedingte Aktion). Werden Tiere in eine Problemsituation gebracht, die sie zufällig oder durch Ausprobieren lösen, wird die erfolgreiche Verhaltensweise in denselben oder ähnlichen Problemsituationen beibehalten bzw. bald prompt erneut angewandt (Lernen am Erfolg). Wird nicht abgewartet, bis die Versuchstiere zufällig eine gewünschte Verhaltensweise zeigen, sondern jede minimale Verhaltensänderung in Richtung auf das gewünschte Endverhalten gleich verstärkt, z.B. in einer Skinner-Box, erfolgt das Lernen wesentlich schneller (operante bzw.instrumentelle Konditionierung). Nach diesem Prinzip erfolgen auch viele Tier-Dressuren. Hier wird nicht das Antwortverhalten wie beim Reiz-Reaktions-Lernen, sondern das Wirkverhalten konditioniert, bei dem das Tier von sich aus die Umwelt zu beeinflussen versucht. Dieses spontane Verhalten zeigt, daß Organismen aktiv in die Welt eingreifen und nicht nur direkt auf äußere Reize antworten. Beim Reiz-Reaktions-Lernen lösen vorausgehende Reize die Reaktion aus, beim instrumentellen Lernen steht das Verhalten dagegen in Verbindung mit den Ereignissen, die ihm nachfolgen: Die Konsequenzen des Verhaltens beeinflussen dessen künftiges Auftreten. Die Regelmäßigkeit bzw. der hohe Grad an Wahrscheinlichkeit dieser Konsequenzen als Folge des instrumentellen Verhaltens heißt Kontingenz. Sie ist eine Wenn-Dann-Beziehung und drückt eine hohe Wahrscheinlichkeit aus, mit der ein bestimmtes Verhalten einen bestimmten Effekt erzielt. Instrumentelles Lernen führt zur Ausbildung von Gewohnheiten. Es ist routinemäßig, motiviert und zielgerichtet, aber eng an bestimmte Situationen gebunden und deswegen relativ starr. Je nach Konsequenz werden verschiedene Formen des instrumentellen Lernens unterschieden: positive und negative Verstärkung, die zum Aufbau des Verhaltens, sowie Bestrafung und Löschung, die zum Abbau des Verhaltens führen ( vgl. Infobox 3 ).
6) Nachahmungslernen (Beobachtungslernen, Modell-Lernen, Imitationslernen; Nachahmung) basiert auf der Beobachtung des Verhaltens anderer Individuen. Sind dessen Konsequenzen vorteilhaft (stellvertretende Verstärkung), wird es teilweise in das eigene Verhaltensrepertoire aufgenommen oder führt zu dessen Modifikation. Als Grundlage für soziales Lernen ist Nachahmungslernen eine essentielle Voraussetzung für die Entstehung und Entwicklung von Kultur.
7) Kognitives Lernen (Einsichtslernen, einsichtiges Lernen;vgl. Infobox 4 ) basiert auf Selbstbeobachtung, Selbstbewertung und Selbstverstärkung, einem gedanklichen Durchspielen von Verhaltensformen („inneres Versuch-und-Irrtum-Lernen") und der Einsicht in Funktionszusammenhänge, Mechanismen, Gesetzmäßigkeiten, Konsequenzen usw. Charakteristisch dafür ist eine zielgerichtete Neukombination von Verhaltenselementen.
8) Implizites Lernen vollzieht sich ohne Bewußtsein und wird auch bei Defekten des expliziten Gedächtnisses nicht beeinträchtigt. Beispiele hierfür sind priming, Wahrnehmungslernen, motorisches Lernen ( vgl. Infobox 5 ) und Gewohnheiten.
9) Maschinelles Lernen: Mit Computersimulation (neuronale Netzwerke, künstliche Intelligenz) können Teile der zentralnervösen Leistungen simuliert werden. Dabei lassen sich verschiedene Lernregeln und Verschaltungs-Architekturen studieren sowie emergente Eigenschaften von Nervengewebe demonstrieren, die sich trotz einer genauen Kenntnis von Schaltplänen und Lernregeln nicht voraussagen oder in allen Einzelheiten nachvollziehen lassen. angeborene Lerndisposition, assoziatives Lernen, Bewegungslernen, Chronobiologie, Dialekt, Durchgang, erlerntes Verhalten, Homologie, Imitationslernen, inzidentelles Lernen, kulturelle Evolution, Langzeitdepression, Lernphase–Kannphase, new drives, nicht-assoziatives Lernen, Stimmungsübertragung, Transfer; Lernen , Kaspar-Hauser-Versuch .
Lit.:Alkon, D.: Memory Traces in the Brain. Cambridge 1987. Bandura, A.: Sozial-kognitive Lerntheorie. Stuttgart 1979. Bower, G.H., Hilgard, E.R.: Theories of learning. Englewood Cliffs 51981. Edelmann, W.: Lernpsychologie. Weinheim 51996. Gallistel, C.R.: The Organization of Learning. Cambridge 1990. Hassenstein, B.: Instinkt, Lernen, Spielen, Einsicht. München 1980. Rahmann, H. u. M.: Das Gedächtnis. München 1988. Rensch, B.: Gedächtnis, Begriffsbildung und Planhandlungen bei Tieren. Berlin, Hamburg 1973. Squire, L.R., Kandel, E.R.: Gedächtnis. Heidelberg, Berlin 1999. Vaas, R.: Neurobiologische Grundlagen des Gedächtnisses. Futura 9, 196–209 (1994). Zeiler, M.D., Harzem, P. (Hrsg.): Biological factors in learning. Chichester 1983.
Lernen
3: Positive und negative Verstärkung.
Eine positive Verstärkung kann kontinuierlich oder intermittierend (gelegentlich) erfolgen. Sie besteht in der Darbietung einer angenehmen Konsequenz und erhöht die Häufigkeit oder Intensität eines Verhaltens. Ist die Zeit zwischen Verhalten und Verstärkung zu lang (z.B. über 5–30 s), kann der Lerneffekt im Tierversuch unterbleiben. Durch Verstärkung lassen sich ganze Verhaltensketten konditionieren. Die negative Verstärkung besteht im Entzug einer aversiven Konsequenz (z.B. Lärm, Kälte, Angst, Schmerz; Aversion). Dieses instrumentelle Lernen äußert sich als Fluchtlernen (Flucht- und Abschaltverhalten) oder als Vermeidungslernen (Ausweich- und Vorbeugungsverhalten; avoidance, Vermeidungsverhalten). Negative Verstärkung ist von der Bestrafung zu unterscheiden, die immer zu einer Schwächung oder Unterdrückung eines Verhaltens führt. Dies geschieht durch Darbietung unangenehmer Konsequenzen (positive Bestrafung) oder den Entzug angenehmer Ereignisse (negative Bestrafung). Strafen haben Verbotscharakter: Sie sind repressiv und zielen vorrangig auf das Unterlassen eines Verhaltens, nicht zu einer Verstärkung, die Gebotscharakter hat. Verhalten wird durch Strafe oder deren Androhung nicht aufgebaut, da man für etwas, das man nicht tut, auch nicht bestraft werden kann. Man kann aber unter bestimmten Bedingungen gezwungen werden, z.B. ein Verhalten zu unterlassen. Allerdings sind Strafen häufig nicht effektiv, da sie das Verhalten meistens nur unterdrücken. Es tritt wieder auf, wenn es ungestraft ausgeführt werden kann (von unerwünschten Nebenwirkungen bis hin zu Angststörungen ganz abgesehen): „Wenn die Katze aus dem Haus ist, tanzen die Mäuse auf dem Tisch“.
Komplexe Lernsituationen sind häufig von Konflikten geprägt. Unterschieden wird zwischen Appetenz-Appetenz-Konflikten (z.B. der Wahl zwischen einem guten Buch und einem guten Kinofilm), dem Appetenz-Aversions-Konflikt (z.B. wird für die Ausführung einer unangenehmen Tätigkeit eine Belohnung versprochen) und einem Aversions-Aversions-Konflikt (unangenehme Tätigkeiten werden durch Androhung noch unangenehmerer Maßnahmen erzwungen).
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.