медицинский портал медикул.ру

Сегодня 22 июнь 2017 года
Медицинский словарь Медицинские учреждения Медицинские препараты Анатомия человека О сайте




Мед разделы:


Главная страница
Традиционная медицина
Народная медицина
Секреты красоты
Питание и здоровье
Все о мозге человека
Поиск по сайту
Карта сайта


телефоны экстренной помощи






Обучение путем оперантного обусловливания



Обучение путем оперантного обусловливания

При павловском, или классическом, обусловливании раздражитель, бывший ранее индифферентным, постепенно приобретает способность вызывать двигательную или секреторную реакцию, которая обычно представляет собой автоматический ответ на входной стимул совершенно иного рода. При оперантном, или инструментальном, обусловливании индифферентный раздражитель постепенно становится стимулом для такой двигательной реакции, которая находится под контролем воли животного. В экспериментах Роджера Сперри у кошек, научавшихся открывать дверцу с надлежащим символом,  происходило оперантное обусловливание. Поскольку оно может успешно осуществляться в опытах с самыми разнообразными животными, посмотрим, что нового может дать нам анализ более простого случая — обучения дождевого червя.
Еще 50 лет назад [31] было установлено, что дождевой червь способен освоить задачу с простым пространственным лабиринтом. В Т-образном туннеле он может научиться, дойдя до места разветвления, поворачивать направо и получать в результате этого «награду» в виде слоя влажного ила, но не сворачивать влево, где он будет «наказан» неприятным раздражителем— электрическим ударом или наждачной бумагой. Такого рода приобретенное поведение, по-видимому, отличается от павловского, или классического, условного рефлекса только тем, что двигательная реакция здесь относится к типу, который мы обычно считаем более «произвольным», чем автоматические, врожденные рефлексы, используемые в классических экспериментах. Правда, в случае такого примитивного организма, как дождевой червь, можно с известным основанием утверждать, что все двигательные акты являются просто автоматическими реакциями на внешние условия. Однако в процессе обучения дождевого червя правильному повороту в точке разветвления невозможно создать такие условия, чтобы всегда происходила одна и та же двигательная реакция— в одних случаях червь будет поворачивать налево и подвергаться наказанию, а в других случаях— поворачивать направо и получать-награду.
При оперантном обусловливании элементы вознаграждения и наказания, по-видимому, необходимы, тогда как в процедуру классического обусловливания они могут и не входить. При классическом обусловливании, как показали, например, эксперименты с установлением межкортикальных связей, проведенные в Мичиганском университете, или опыты с выработкой у людей способности произвольно регулировать сужение зрачков и температуру отдельных частей тела, не было никакой проблемы мотивационных раздражителей: установление связи между сенсорным входом и двигательной реакцией было простым и прямым следствием многократного повторения одного и того же сочетания «стимул — реакция». Но при выработке у дождевого червя навыка поворачивать направо, а не налево, возможны две двигательные реакции на тот сенсорный сигнал (в чем бы он ни состоял), который указывает червю на разветвление хода. Для выработки избирательной формы поведения необходим какой-то нейронный механизм, устанавливающий связи между «пусковым» сенсорным сигналом и обеими программами двигательных реакций, причем связь с одной из двух возможных реакций должна закрепляться прочнее, чем с другой. Во всех экспериментах с оперантным обусловливанием оказывалось, что усиливается та реакция, которая наилучшим образом удовлетворяет какую-то физиологическую потребность организма, например потребность в пище, в половой активности или в физическом «комфорте».
В явлениях оперантного обусловливания содержатся интересные указания относительно процессов, связанных с памятью. После того как червь сделал у разветвления ходов лабиринта поворот вправо или влево, он должен некоторое время ползти дальше, прежде чем он будет вознагражден или наказан за свой выбор. Из этого очевидно, что сенсорная и двигательная информация, относящаяся к данному эпизоду, должна некоторое время сохраняться, чтобы связи между соответствующими группами нейронов могли быть относительно усилены или ослаблены после того, как животное получит оценку своих действий в виде возникающего в конце пути приятного или неприятного ощущения. Такого рода ретроспективное усиление или ослабление образовавшихся «пробных» нейронных связей под действием эмоционального сигнала, по-видимому, имеет что-то общее с рассмотренным ранее действием концентрации внимания — извлечением из угасающих следов кратковременной памяти детальной информации, которая иначе была бы потеряна.

При оперантном обусловливании число возможных реакций, из которых животное научается делать выбор, отнюдь не ограничено двумя. Рассмотрим, например, случай, когда животное обучают нажимать рычаг при включении света. Этого можно достичь, воспользовавшись естественным «любопытством» и беспокойством животного, посаженного в клетку. Рычаг располагают таким образом, чтобы животное при своем бесцельном блуждании по клетке время от времени наступало на него. Если это произойдет в тот момент, когда включен свет, поведение животного подкрепляют, награждая его кусочком пищи. С течением времени поведение изменяется; это изменение, характеризуемое «кривой обучения», в конце концов приводит к тому, что животное нажимает рычаг, как только вспыхивает свет. Когда такая реакция вырабатывается у обезьяны, у нас легко возникает мысль, что животное «догадывается, в чем дело», и в дальнейшем сознательно управляет своим поведением. Когда подобного же результата достигает крыса или еще более примитивное животное, гораздо легче представить себе, что мы имеем дело с автоматическим процессом, который носит машинообразный характер и не связан с тем, что мы называем мышлением.
Доводы в пользу автоматической, механической природы оперантного обусловливания можно подкрепить сравнением скорости обучения у высших и низших животных. Дождевой червь усваивает определенное поведение в Т-образном лабиринте за 100—200 проб. Примерно такое же число проб требуется кошке, чтобы научиться отвечать на зрительный сигнал ударом по рычагу и тем самым избегать неприятного вдувания струи воздуха в ухо. Описан эксперимент, проведенный с 6-месячным ребенком с целью определить, сколько проб понадобится для того, чтобы «отучить» его от попыток прикоснуться к пламени свечи. (Разумеется, опыты ставились так, что руку ребенка отводили от пламени прежде, чем мог произойти ожог.) Число необходимых проб оказалось таким же, как и при обучении дождевого червя,— около 150!

О наличии примитивного, автоматического компонента в процессе обучения свидетельствует также возможность обучения декортицированных животных (если только задача не требует сенсорного различения, способность к которому утрачивается после удаления коры). Эрнандес-Пеон установил даже, что декортицированная кошка может научиться поднимать лапу, чтобы избежать электрического удара после предупреждающего звука зуммера, и научиться так же быстро, как и нормальная кошка! Однако наиболее поразительны недавние эксперименты с планариями (плоские черви). Если планарию разрезать надвое, то у передней половины регенерирует «хвост», а у задней—«голова», и примерно через три недели мы получаем двух нормальных червей вместо одного. Для нас интересно следующее: если в опыте использован обученный червь — усвоивший какую-нибудь оперант-ную реакцию, например поворот в Т-образном лабиринте,— то не только червь, образовавшийся из прежней «головы», но и тот, который вырос из прежнего «хвоста», при испытании будет сразу же вести себя правильно! Такой результат очевидным образом связан с тем, что в различных участках тела червя имеются сходные скопления нейронов — самые близкие аналоги головного мозга, которые только могут быть у этих примитивных организмов; он показывает также, что и здесь, в механизме хранения следов прошлого опыта у планарий, природа обеспечила избыточность. Но, кроме того, этот результат подкрепляет представление о том, что процессы, лежащие в основе оперантного обусловливания, крайне примитивны.
Не следует думать, что планарий, показавшие в этих экспериментах столь блестящие способности, обладают какой-то особой нервной организацией, делающей их необычайно восприимчивыми к оперантному обусловливанию. К какой бы группе животных ни обратился психолог, он найдет, что терпение экспериментатора всегда вознаграждается получением новых данных об универсальности процесса обучения. Если к одной и той же группе щупалец актинии один раз в сутки прикладывать влажную фильтровальную бумагу, щупальца вначале будут подносить ее ко рту, но после нескольких повторений они начнут отвергать ее, п приобретенный таким образом навык будет сохраняться в течение недели или дольше. Однако усвоенная реакция не распространится на щупальца, не участвовавшие в обучении: они будут принимать фильтровальную бумагу даже тогда, когда «обученные» щупальца перестанут реагировать на нее, как на пищу. Обучаться могут даже микроскопические организмы. Дж. У. Френч в 1940 г. нашел, что «практика» заметно сокращает время, необходимое парамециям (инфузориям-туфелькам) для того, чтобы пройти через стеклянную трубочку в привычную для них среду. В сущности неясно даже, обладает ли человек каким-то преимуществом перед животными, когда дело идет о выработке простого условного рефлекса. Применяя методы оперантного обусловливания, можно научить голубей выстукивать клювом определенные мотивы на колокольчиках, тюленей — трубить в рог, а медведей—ездить на велосипеде. Вероятно, среднему человеку понадобится примерно столько же попыток, чтобы тщательно отработать новый способ удара при игре в гольф, а ведь это требует не большего усложнения обычных двигательных навыков, чем различные трюки, которым научаются животные.
Но, с другой стороны, человек может осваивать гораздо более сложные последовательности движений, чем животные; он может также создавать свои собственные, «внутренние» системы вознаграждения и наказания для процесса оперантного обусловливания. Если для комнатной собачки, обучаемой новому трюку, подкреплением правильных действий служит одобрительное слово или ласковое похлопывание со стороны хозяина, то игрок в гольф, отрабатывающий новый удар, создает для своей нервной системы аналогичный сигнал, сравнивая фактическое движение палки или мяча с тем, к чему он стремится, и испытывая положительную или отрицательную эмоцию в зависимости от результатов этого сравнения. Несомненно, именно этот сигнал внутреннего происхождения воздействует на все еще чувствительные группы сенсорных и моторных нейронов, активированные при только что сделанном ударе, усиливает или ослабляет связи между ними .и тем самым повышает или снижает вероятность того, что и в следующий раз движение будет контролироваться на основе тех же нейронных взаимодействий. Сенсорной информацией, с которой в данном случае связывается двигательный акт, служат, конечно, определенные сочетания зрительных сигналов, указывающие положение и движения мяча, палки и частей тела, и проприоцептивных сигналов, касающихся равновесия, быстроты движений, а также степени напряжения и укорочения различных мышц. Когда игрок в гольф осваивает новый удар и когда медведь учится ездить на велосипеде, требуется закрепление целой цепи последовательных условных реакций. В системе памяти должна быть записана информация о тех специфических сочетаниях сенсорных данных, которые служат пусковыми сигналами для соответствующих подпрограмм мышечной активности. Когда «сличающие устройства» головного мозга обнаружат, что конфигурация входных сенсорных сигналов в достаточной мере совпадает с одной из записанных ранее «пусковых» конфигураций, к соответствующей двигательной подпрограмме должен быть послан надлежащий пусковой сигнал. Все эти связи между последовательными комплексами следов памяти, отражающими сенсорную картину окончательно отработанного удара, и соответствующими двигательными программами устанавливаются постепенно, в результате автоматических электрохимических процессов оперантного обусловливания. Эмоциональные сигналы «одобрения» и «неодобрения» укрепляют или ослабляют эти связи, так что происходит постепенное исправление двигательных программ, пока желаемое совершенство навыка не будет, наконец, достигнуто.
Нужно признать, что даже такой анализ не позволяет полностью разложить процесс отработки нового удара при игре в гольф на ряд последовательных процессов оперантного обусловливания, в точности аналогичных тому, что происходит при обучении дождевого червя в Т-образном лабиринте. Дело в том, что мы не учли обратных связей, 'благодаря которым точная последовательность  сенсорных  стимулов,  получаемых игроком, сама зависит от его двигательных реакций на эти стимулы. В действительности по мере обучения происходит   постепенное   видоизменение   сенсорных раздражителей, на которые вырабатываются условные двигательные реакции. Это непрерывное изменение задачи, подлежащей решению, несомненно, увеличивает трудности и, возможно, помогает нам объяснить тот факт, что игроку в гольф нужно гораздо больше времени для отработки нового удара, чем дождевому червю— для освоения задачи с лабиринтом. Тем не менее, по-видимому, нет необходимости предполагать какой-либо существенно иной принцип обучения. Ни в одной из этих ситуаций мы не имеем дела с абсолютно идентичными комплексами раздражителей и реакций; вероятно, всегда допустимо известное различие между «пусковым» комплексом, записанным в памяти, и конфигурацией входных сенсорных данных, которую «сличающие устройства» найдут достаточно сходной с этим комплексом. До тех пор пока последовательность сенсорных комплексов у игрока в гольф не изменяется слишком быстро от попытки к попытке, должен продолжаться нормальный процесс оперантного обусловливания, который постепенно приведет к достаточной стандартизации комплексов двигательных реакций, а в результате этого и комплексов входных раздражителей. Можно было бы придумать вариант игры в теннис с квадратным мячом на неровной площадке и с ракеткой, имеющей волнистую поверхность. Невозможность серьезно рассматривать вопрос о введении такой игры в практику можно обосновать тем, что она была бы недостаточно приспособлена для процессов оперантного обусловливания. Игрок был бы не в состоянии подобрать серию маневров и ударов, которая постепенно сводилась бы к достаточно малому числу стандартных ситуаций; ведь для успешной игры требуется воспроизводимая и, значит, доступная для обусловливания последовательность сенсорных и двигательных комплексов.



Ключевые слова: Обучение путем оперантного обусловливания
Опубликовано: 2013-10-11 13:45:15


Словарик заболеваний:

Аллергозы респираторные

Бели

Баугинит

Артериомезентериальная непроходимость частичная

Амблиопия обскурационная





Поиск:




Medicul.ru (c) 2006-2017 все права защищены.