Слике мозга откривају како делују стратегије учења

Нова истраживачка студија истражује како мозак ажурира нашу меморијску банку како би побољшао наша очекивања од будућих награда.

Освежавање је неопходно како бисмо могли да направимо тачна предвиђања о тим наградама у условима променљивог окружења.

Иако тачно како мозак оркестрира овај процес остаје нејасно, ново истраживање сугерише да комбинација две различите стратегије учења води наше понашање.

У часопису ће се појавити рад о делу Неурон.

Једна прихваћена стратегија учења, која се назива учење без модела, ослања се на поређење покушаја и грешака између награде коју очекујемо у датој ситуацији и награде коју заправо добијамо.

Резултат овог поређења је генерисање „грешке у предвиђању награде“, која одговара тој разлици.

На пример, грешка у предвиђању награде може одговарати разлици између пројектованог новчаног приноса на финансијску инвестицију и наше стварне зараде.

У другом механизму, који се назива учење засновано на моделу, мозак генерише когнитивну мапу околине која описује однос између различитих ситуација.

„Учење засновано на моделу повезано је са стварањем„ грешке у предвиђању стања “, која представља ниво изненађења мозга у новој ситуацији с обзиром на његову тренутну процену околине“, каже Јан Гласцхер, постдокторски научник у Цалтецх-у и водећи аутор студије.

„Размислите о ситуацији у којој увек идете истим путем када се возите кући након посла, али одређеног дана уобичајени пут је блокиран због грађевинских радова“, каже Гласцхер.

„Систем учења без модела био би беспомоћно изгубљен; бави се само предузимањем радњи које су у прошлости биле корисне, па ако те радње више не буду доступне, неће моћи да одлучи куда даље.

„Али систем заснован на моделу могао би да постави упит на своју когнитивну мапу и схвати ефикасан заобилазни пут користећи алтернативни пут.“

„Иако је једноставнији механизам учења без модела добро проучен и његов основни механизам учења - који је вођен грешкама предвиђања награда - је релативно добро разумљив, механизми који леже у основи софистициранијег система учења заснованог на моделу, са богатом прилагодљивошћу и флексибилношћу , мање се разумеју “, каже Јохн П. О'Дохерти, професор психологије на Цалтецх-у.

Да би даље окарактерисали неуролошке основе ова два система учења, Гласцхер, О'Дохерти и њихове колеге дизајнирали су рачунарски заснован задатак доношења одлука који им је омогућио да мере када и где мозак рачуна сигнале грешака у награђивању и предвиђању стања и да би се утврдило да ли две врсте грешака у ствари производе различите неуронске потписе.

У задатку, испитаници су морали да бирају између кретања лево и десно што им омогућава да се крећу између различитих „стања“ - означених графичким иконама - у виртуелном окружењу; поступак је сличан ономе кретања у једноставној видео игри.

Сваки избор лево или десно направљен у овом виртуелном окружењу водио је субјекта у ново стање. Њихов циљ је био да дођу до одређене државе циља да би добили новчану награду, „а шансе да заврше у том стању циља снажно су зависиле од одређеног обрасца секвенцијалних избора које су донели“, објашњава О’Дохерти.

Систем заснован на моделу може научити о структури виртуелног окружења, а затим користити ове информације за израчунавање радњи потребних за достизање стања награде, на начин аналоган начину на који шахиста може покушати да размишља кроз секвенцијалне шаховске потезе потребне да добије утакмицу.

Систем без модела, с друге стране, научио би само слепо да бира оне акције које су у прошлости доносиле награду, без процене последица у тренутној ситуацији.

Осамнаест учесника је скенирано помоћу функционалне магнетне резонанце док су научили задатак. Скенирање мозга показало је карактеристичан, претходно окарактерисани неуронски потпис грешке предвиђања награде - генерисану током учења без модела - у пределу у средини мозга који се назива вентрални стриатум.

Током учења заснованог на моделу, међутим, неуронски потпис грешке у предвиђању стања појавио се у два различита подручја на површини мозга у кори великог мозга: интрапариетални сулкус и бочни префронтални кортекс.

Ова запажања сугеришу да се два јединствена типа сигнала грешке рачунају у људском мозгу, јављају се у различитим регионима мозга и могу представљати засебне рачунске стратегије за вођење понашања.

„Систем без модела функционише врло ефикасно у ситуацијама које су високо аутоматизоване и понављају се - на пример, ако редовно идем истом рутом кући с посла“, каже Гласцхер, „док систем заснован на моделу, иако захтева много веће мозгове процесорска снага, у стању је флексибилно да се прилагоди новим ситуацијама, као што је потреба за проналажењем нове руте пратећи блокаду пута. “

Ова два различита механизма учења служе комплементарним улогама у контроли људског понашања, каже Гласцхер.

„Будући да је процесорска снага нашег мозга ограничена, нема смисла примењивати рачунски интензивнији систем заснован на моделу за контролу свега што радимо. Уместо тога, боље је да се ослањамо на систем без модела током већег дела нашег свакодневног понашања и систем заснован на моделу користимо само за нове или сложене ситуације. Важно подручје за даља истраживања биће покушај разумевања фактора који управљају начином на који ови системи међусобно комуницирају како би се контролисало понашање и утврдило како се то примењује у мозгу “.

Извор: Калифорнијски институт за технологију

!-- GDPR -->