Aus Fehlern lernt man: Feedback-Mechanismen im Gehirn funktionieren auch ohne Belohnung
Beim Lernen spielen Belohnungen oft eine Rolle, weil man glaubt, dadurch den Erfolg unterstützen zu können. In der Schule bekommen Kinder gute Noten oder werden gelobt. In wissenschaftlichen Lernexperimenten wird in der Regel mit Belohnungsreizen wie Geld gearbeitet. Dr. André Brechmann und Dr. Susann Wolff vom Leibniz-Institut für Neurobiologie (LIN) Magdeburg haben nun herausgefunden: Auch ohne positives Feedback durch Belohnung können Versuchspersonen durchaus schnell Strategien erlernen, um richtige von falschen Tönen zu unterscheiden. Ihre Studie ist im Fachmagazin Cerebral Cortex erschienen.
Es piepst. War das jetzt ein Zielton oder nicht? Bei der richtigen Kombination von Toneigenschaften die korrekte Taste zu drücken, ist die Aufgabe der Personen, die bei dem Experiment am LIN mitmachen. Dabei müssen sie bei den Tönen fünf Eigenschaften in zwei Ausprägungen voneinander unterscheiden: laut und leise, kurz und lang, auf und ab, hoch und tief sowie schnell und langsam. Studienleiter Brechmann erklärt: „Wir haben bei 55 Teilnehmenden untersucht, welche Strategien sie entwickeln, um die richtige Kombination zu finden, und ob sie ihre Strategie anpassen können, wenn wir die Tastenbelegung wechseln.“
Die beiden Neurowissenschaftler haben dabei mit Feedback-Mechanismen gearbeitet, die nichts mit Belohnungen zu tun haben. „In einer Vorarbeit konnten wir bereits zeigen, dass eine akustische Information ,Taste wurde gedrückt´ schon ausreicht, um das Belohnungssystem zu aktivieren“, so Wolff. Im jetzigen Experiment mussten die Probandinnen und Probanden durch Versuch und Irrtum mit akustischem Feedback herausfinden, welche Tonkombination richtig ist und welche nicht. Zuerst mussten die Teilnehmenden raten und dann eine Strategie entwickeln, um die Zielkategorie herauszufinden.
Die Aufgabe war so schwer, dass es einige nicht geschafft haben, andere haben nur eine der Toneigenschaften herausgefunden, und wieder andere hatten spätestens beim Tausch der Tastenbelegung Schwierigkeiten, umzulernen. „Es kam also für alle darauf an, aus negativen Rückmeldungen zu lernen, um die richtige Strategie zu finden. Mit Hilfe der Magnetresonanztomographie konnten wir sehen, wo im Gehirn diese negative, aber hilfreiche Erfahrung für eine zusätzliche Aktivierung sorgte“, berichtet Wolff.
Brechmann fügt hinzu: „Fehler sind nicht alle gleichbedeutend: Beim initialen Lernen sind sie gar nicht zu vermeiden, wohingegen sie beim Wechsel der Tastenbelegung unerwartet sind – bis man herausfindet, dass sich die Spielregeln geändert haben. Es geht darum, aus den Fehlern zu lernen und flexibel eine Strategie zu entwickeln. Und um komplexe Zusammenhänge zu begreifen, braucht das Hirn zwar die sogenannten Belohnungszentren, aber nicht unbedingt eine Belohnung.“
In zukünftigen Studien wollen sich die Magdeburger auf die Teilnehmenden konzentrieren, die Probleme beim Umlernen hatten, und diese mit individuellem Feedback unterstützen. Außerdem wollen sie weitere Messwerte wie Puls, Hautleitwert, Atmung oder elektrische Hirnströme in die Auswertung einfließen lassen.
Wissenschaftlicher Ansprechpartner:
Dr. André Brechmann
Originalpublikation:
https://academic.oup.com/cercor/advance-article/doi/10.1093/cercor/bhac473/6927243