Поведение и система за възнаграждение чрез обучение

поведение

Кучета, чиито уста се поливат при звук на камбана. Бебета плачат при вида на бяла мишка. Морски охлюви, които придърпват хрилете си при стимулиране: При асоциативното обучение неутралните стимули получават ново значение.

  • Ако са свързани две събития, които не са естествено свързани помежду си, едното говори за асоциативно обучение.
  • В това, което е известно като класическо обуславяне, стимул, който предизвиква измерима реакция, се комбинира със стимул, който не го индуцира естествено. Важно е двата стимула да си следват директно един друг.
  • При оперантно обуславяне човек се научава да свързва стимул с награда или наказание. Тя променя поведението си в резултат на последствията. Допаминът е важно пратено вещество в асоциативното обучение и повишава очакванията. Като невротрансмитер на очакване, той е важен мотиватор.

Допаминът е важно пратено вещество на централната нервна система, което принадлежи към групата на катехоламините. Играе роля в двигателните умения, мотивацията, емоциите и когнитивните процеси. Нарушенията във функцията на този предавател играят роля при много заболявания на мозъка, като шизофрения, депресия, болест на Паркинсон или зависимост от вещества.

Невротрансмитери

Невротрансмитерът е химично вещество, посредник. Той се освобождава от изпращащия неврон в местата на комуникация между клетките и има възбуждащ или инхибиращ ефект върху неврона реципиент.

Вдъхновен, наред с други неща, от експериментите на Павлов върху класическата обусловеност, американският психолог Джон Б. Уотсън лансира бихевиоризъм в началото на 20 век. Тази мисловна школа доминира в американската психология в продължение на много десетилетия. Само наблюдаваното поведение се смята за обект на научни изследвания от изследователи като Уотсън или Скинър. Бихевиористите не искаха нищо общо със спекулациите относно вътрешните психични състояния.

Голяма част от това отношение се отразява и в разбирането им за учене. Ученето се показа съответно в промяна в поведението на околната среда. За бихевиористите обучаемият е по същество пасивен и реагира само на стимули от заобикалящата го среда. Той създава връзки стимул-стимул и стимул-отговор. За представителите на тази мисловна школа хората дойдоха на света като празен лист, който постепенно се напълва със съдържание чрез опит.

Тази гледна точка намери своите критици в привържениците на когнитивния подход. Те изхождаха не само от външно наблюдаеми стимули и реакции, но и от вътрешна обработка на информация. Поне висшите организми са в състояние да придобиват и съхраняват информация. Новата информация може да бъде свързана със съхранената информация и по този начин да доведе до ново поведение. По този начин решенията на проблемите могат да бъдат намерени бързо - без да се налага да реагирате многократно на стимул.

Както често се случва при изследванията, всичко започна с голямо съвпадение - и този път това бяха стъпките на лаборант. Руският лекар и физиолог Иван Павлов (1846-1936) от известно време изучава храносмилателния процес при кучета - изследвания, за които по-късно ще получи Нобелова награда. По този начин той направи изненадващо откритие: храносмилателният процес на тестваното му животно започна не само когато храната му беше в устата. Слюнката започна да тече веднага щом кучето чу стъпките на лаборанта - очевидно сигналът за животното, че се приближава до храна.

Интересът на Павлов се възбуди и той систематично разследва това явление. Изследователят имплантира тръба в слюнчената жлеза при кучета, за да измери потока на слюнката. От този момент нататък той звъни със звънец за храната на животните. Отначало шумът остави кучетата студени. Това едва ли е изненадващо, защото няма естествена връзка между звука на камбана и яденето. Но след няколко пъти звъненето беше станало важно за животните и предизвика слюноотделяне дори без храна. Кучетата бяха научили, че след звука на купата с храна тя се пълни. А Павлов беше открил важен учебен механизъм: класическа обусловеност.

възнаграждение

Неутралната става условен стимул

Преди животните да започнат да свързват звука на камбаната с храната, звъненето е било неутрален стимул - без конкретно значение за кучетата. Но сега бяха свързали две събития заедно чрез асоциативно обучение. Говорим за класическо обуславяне: стимул, който естествено предизвиква измерима реакция, е свързан с друг, който обикновено не би причинил това поведение.

Павлов описа първия стимул, храната, като безусловен или безусловен стимул. Тук потокът на слюнката се задейства от „апетитен рефлекс“, който е вроден и улеснява транспортирането на храната в стомаха. В случай на условния стимул, звукът на камбаната, от друга страна, е необходим процес на обучение, така че той да предизвика желаната реакция. Както отбеляза Павлов, времето е важно: трябва да представите двата стимула на животното едновременно или в бърза последователност. Колкото по-малко е закъснението между условния и безусловния стимул, толкова по-бързо и по-интензивно животното придобива условния отговор.

Не само кучетата, но и хората могат да си напоят устата, когато си мислят само за вкусното печено, което къкри във фурната, или когато подушат вкусната му миризма, която се носи в кухнята - много преди месото да е на масата Плоча и завършва в устата ви. Американският психолог Джон Б. Уотсън (1878-1959) открива през 1920 г. в своя най-известен, но и силно противоречив експеримент, че класическото кондициониране работи и с Homo sapiens. Уотсън научи бебе на име Алберт да се страхува - от бяла мишка. Той успя да направи това, като многократно изплаши малкия със силен удар с чук върху метален прът и по този начин го разплака. В същото време изследователят показа на детето бяла мишка. След известно време гризачът вече не беше неутрален стимул за малкия Албърт: той се страхуваше от гледката, дори без да чуе пукането на чука - и започна да плаче.

Морков и пръчка

Класическото кондициониране обаче не показва никакво наистина ново поведение. По-скоро се задейства естествено поведение - макар и чрез стимул от различен контекст. Ако например кучето трябва да научи трик, да кажем да изпълнява роля по команда, се изисква друга форма на обучение: оперантно кондициониране. Първата стъпка е да накарате кучето да направи номера. Ако успее, може да очаква награда, почерпка или специално внимание. Ако кучето трябва да запомни това, което не му е позволено - например раздробяване на вестника на господаря си - то също може да бъде наказано. Това обаче е по-трудно. Следователно се говори за „учене чрез награда или наказание“ или „учене от успех“. Поведението се променя в резултат на последствията.

Психологът Едуард Торндайк (1874-1949) от Колумбийския университет е първият, който изучава подробно оперантното кондициониране в началото на 20 век - дори и да не му е дал това име. Торндайк сложи гладни котки в специално изградена клетка и им предложи парче риба - извън затвора. За да излязат на свобода и накрая до желаната храна, те трябваше да разберат за механизма на кутията и да задействат болт. Това очевидно беше трудно за животните в началото. Случайно те получиха болта, докато се скитаха безцелно, вратата се отвори и те успяха да получат наградата. След няколко опита те започнаха целенасочено да отварят резето веднага щом бяха поставени в кутията. Бяха научили нещо. Внезапно прозрение, аха преживяване за котките, обаче не ставаше въпрос, защото те усещаха пътя си твърде бавно към решението на загадката. По-скоро домашните тигри откриха бара на принципа на пробата и грешката. Торндайк подозира, че връзката между клетката и моделите на движение, които помагат на котките да се освободят, става все по-силна с всяко бягство.

внимание

Вниманието ни служи като инструмент за съзнателно възприемане на вътрешни и външни стимули. Постигаме това, като концентрираме умствените си ресурси върху ограничен брой съдържания на съзнанието. Докато някои стимули автоматично привличат вниманието ни, ние можем да избираме други контролирано. Мозъкът също така несъзнателно обработва стимули, които не са във фокуса на нашето внимание.

В кутията на Скинър

Терминът "оперантно обуславяне" е окончателно измислен от американския психолог Бур Фредерик Скинър (1904 - 1990), изобретател на известната кутия на Скинър. В оригиналната си проста форма, това е кутия, снабдена с изпъкнал лост и купа за храна, поставена отдолу. Ако животното - Скинър предпочита гладни плъхове и гълъби - случайно дръпне лоста, то получава хранителни топки. Тази награда е стимул да използвате лоста все по-често с течение на времето. И обратно, обусловеното поведение също може да бъде изтрито отново, като изключите подаващия кран. Като цяло се прилага следното: Наградата, така наречения положителен подсилващ елемент, увеличава вероятността да се развие определено поведение. Наказанието, като скок на тока, ги понижава. Например при хората потупването по гърба може да служи като социален подсилващ елемент - прост жест на признателност, който ги мотивира да показват по-често определено поведение отсега нататък.