Дипломная работа: Влияние подкрепления и наказания на поведение

Когда после поведения следуют приятные последствия, появляется тенденция к его повторению, а если следуют неприятные или неудовлетворительные последствия, происходит отказ от повторения. Торндайк Э.Л.

Дата добавления на сайт: 27 сентября 2024


Скачать работу 'Влияние подкрепления и наказания на поведение':


Министерство образования и науки Российской Федерации
федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Российский государственный гуманитарный университет»
ДИПЛОМНАЯ РАБОТА
на тему:
«Влияние подкрепления и наказания на поведение»
Выполнил студент
Руссков Степан Андреевич
Института психологии им. Выготского
Факультета Психологии (бакалавриат)
Группа: ИП-133
Научный руководитель: Тихомирова И.В.
Москва, 2017 год

Оглавление
Введение
. Теоретические основания исследования
.1 Награды, подкрепление и наказание
.2 Планирование режима подкрепления
.3 Какой режим подкрепления является "наилучшим"
.4 Система наград в типичных приключенческих видеоиграх
.5 Параллельные режимы подкрепления
.6 Практические вопросы реализации системы вознаграждения в игре
.7 Какие награды может предложить наука
.8 Позитивное и негативное подкрепление и наказание как факторы воздействия на поведение
. Эмпирическое исследование
.1 Проблемы и цели
.2 Процедура эксперимента
.3 Результаты исследования
.4 Научение посредством подкрепления
Выводы
Список использованных источников
Приложения

Введение
Когда после поведения следуют приятные последствия, появляется тенденция к его повторению, а если следуют неприятные или неудовлетворительные последствия, происходит отказ от повторения. Торндайк Э.Л.
Одной из основных задач психологии является возможность предсказания поведения человека. Необходимое и обязательное условие научного метода проявляется в способности интерпретировать результаты экспериментов, основываясь на собственной теоретической базе. В психологии для подтверждения теории обязательными требованиями являются:
Непротиворечивость
Соответствие экспериментальным данным
Возможность предсказывать новые явления
Возможность описывать известные явления
Фальсифицируемость
Актуальность проблемы: Целью данной работы является анализ литературных данных по проблемам подкрепления и практической оценки влияния подкрепления и наказания на поведение. Большая часть работы посвящена исследованию поведения человека в медиа и видеоигровых пространствах, так как это позволяет повысить экономность исследования, провести анализ новых актуальных тем, нуждающихся в освещении. Поведение человека представляет собой направленные к чему-то или от чего-то, в какой-то мере осмысленные и целесообразные социально или личностно значимые действия, источником которых является сам человек и ответственность за которые возлагается на него. Видеоигрой считается игра между человеком и вычислительной системой (либо между множеством людей) с использованием изображений, сгенерированных электронной аппаратурой. Первая запатентованная игра появилась в 1968 году, то есть менее 50 лет назад. В настоящий момент невозможно определить точное количество людей, играющих в видеоигры, только США в 2010 году насчитывало более 150 миллионов людей играющих в видеоигры и, согласно исследованию Spil Games в 2013 году в мире играют в игры на различных электронных платформах более 1.2 миллиарда людей, что на тот момент равнялось 17% населения планеты Земля. Прибыль игровой индустрии в 2015 году составила 91.8 миллиарда долларов США. Для работы данной индустрии крайне необходим всесторонний научный анализ, исследователи работают над этой проблемой "по обе стороны баррикад". С одной стороны - разработчики игр, перед ними стоит задача создать игру, которая принесёт как можно больше прибыли. С другой стороны - исследователи, целью которых является объяснение популярности игр, проблема игровой аддикции и другие.
Видеоигры сильно повлияли на геополитическую ситуацию в мире - объединяя множество игроков по всему миру и развивая киберспортивную отрасль. Многие страны (в том числе США, Южная Корея и Россия, во время проведения этого исследования - в июне 2016 года) признали киберспорт профессиональным видом спорта. Процесс оформления визы в США для киберспортсменов из разных стран заметно упростился. Игровые компании осуществляют свою деятельность на трансмедийных платформах, регулярно киберспортивные мероприятия собирают аудиторию в сотни тысяч зрителей. По играм снимаются фильмы, пишутся книги, в месяц прямые трансляции видеоигр от самих игроков собирают более 100 миллионов просмотров и многое другое.
Среди исследователей растет число приверженцев людологии. Только в последние десятилетия появилась соответствующая наука, которая занимается всеми вопросами, связанными с компьютерными играми. Людология - наука, занимающаяся исследованиями игр как современной формы коммуникации и творчества. Эта дисциплина представляет собой нечто большее, чем просто математическая модель, если сравнивать её с теорией игр, она поднимает и философские, и теоретические, и практические вопросы, касающиеся компьютерных игр
В западных странах наука людология получила официальный статус уже более 10 лет назад, в начале 2000-х годов. В России, к настоящему моменту, над этой наукой трудятся лишь несколько одиночек-энтузиастов.
Людология ставит во главу угла целый ряд важных вопросов: Почему человек играет, зачем ему это? Какое влияние оказывают игры на играющих? Почему процесс разработки всё время усложняется, а игры становятся всё проще и проще? Какое будущее у индустрии, и какие ещё есть пути развития? Почему игры подразделяются на такие жанры? Почему одни жанры популярнее других? Почему у различных жанров сформировались свои шаблоны игровых интерфейсов? Как реагирует игровая публика на те или другие нововведения? Что в игре действительно нужно игроку, а что просто добавляется по традиции и висит балластом?
Наибольший успех в исследовании видеоигр среди разработчиков в настоящее время показывает Бихевиоризм, что объяснятся сущностью индустрии. Анализ игрового процесса, исследование подкрепления в видеоиграх, объяснение и предсказание поведения игрока - вот на чем специализируется данная теория. Несмотря на ошеломительный успех бихевиоризма данное исследование рассматривает несколько теоретических точек зрения на проблему подкрепления в видеоиграх.
Цель исследования: Анализ эффекта подкрепления в видеоиграх в целом, и у представителей разных социальных групп разработка психодиагностического метода для исследования влияния подкрепления и наказания в видеоиграх.
Объект исследования: влияние подкрепления и наказания на поведение. видеоигра социальный психодиагностический наказание
Предмет исследования: подкрепление и наказание в видеоиграх как детерминанты поведения человека.
Задачи исследования: исследование механизмов функционирования подкрепления и наказания в привычной среде, анализ литературных данных, изучение подкрепления с обучением, разработка метода для исследования влияния подкрепления и наказания в видеоиграх, проведение практической части работы, сопоставление полученных данных с известными математическими моделями предсказывающими эффект влияния наказания и подкрепления в видеоиграх на поведение человека.
Гипотеза исследования: Ненаправленная гипотеза Н1 о существовании различий в эффектах, оказываемых подкреплением и наказанием на поведение у представителей разных социальных групп.
Научная новизна исследования: создание и применение на практике нового психодиагностического метода в рамках предварительного исследования, анализ моделей обучения с подкреплением в рамках видеоигр.
Теоретическая значимость исследования: данные, полученные исследователем, развивают и дополняют ряд существенных аспектов теорий, в которых имеет место подкрепление и наказание, теории классического обуславливания, теории социального научения, теория оперантного научения и др. Основные теоретические результаты исследования могут стать основой для дальнейшего изучения механизма влияния подкрепления и наказания не только в видеоиграх, но и в других сферах человеческой деятельности.
Практическая значимость работы. Выводы, содержащиеся в работе, могут быть использованы при разработке теоретической модели обучения с помощью подкрепления и наказания, основанной на поведенческой и математической психологии, благодаря этому на основе заключений работы может состоятся пересмотр этих факторов как влияющих на поведение. Полученные данные могут быть использованы как в дизайне игровой среды, так для создания терапевтических моделей, снижающих игровую активность.
Структура исследования. Курсовая работа включает в себя следующие разделы: введение, теоретическую часть, практическую часть, заключение, список использованной литературы и приложения.

1. Теоретические основания исследования
.1 Награды, подкрепление и наказание
Наградой считается всё, что увеличивает частоту поведения. Так наградой может быть позитивное событие, следующее за ответом, или уход от аверсивного события. Точно так же наказание является чем-либо, что снижает частоту поведения, и может принимать форму аверсивного события, или ухода от позитивного события Thorndike E. L. Human learning. NY.: Century Company, 1931. Как уже говорилось, ранее психологи, как правило, имели тенденцию относиться к чему-либо, что увеличивает частоту поведения как к подкреплению. Следовательно, награды называют позитивным подкреплением, а уход от наказания называют негативным подкреплением. Реакции испытуемого на стимулы отражены в таблице №1.
Таблица 1 - Влияние позитивных и негативных стимулов на поведение.
Итоги обуславливания
Увеличение частоты поведения Снижение частоты поведения
Позитивные стимулы Предъявление положительного подкрепления Удаление аверсивного стимула
Негативные стимулы Удаление положительного стимула (запрещают) Предъявление аверсивного стимула
Основным фактором, в определении того, будет ли поведение оперантным или нет являются последствия, вытекающие из этого поведения. Если следствием поведения является не то, что признается субъектом подкрепляющим, поведение не будет подкрепляться. Одна группа последствий, которые явно являются подкрепляющими это те, которые удовлетворяют биологические потребности. Пища является очевидным примером подобного подкрепления. Для голодного человека, еда всегда будет иметь подкрепляющий эффект. Подкрепления, которые удовлетворяют биологическую потребность или драйв известны как первичное подкрепление. Они включают в себя еду, воду, и избегание боли.
Однако существуют многие другие последствия поведения, которые люди находят подкрепляющими, даже если они не удовлетворяют биологическую потребность. К примеру, люди которые не обладают врожденным желанием иметь деньги, с течением жизни учатся принимать деньги как подкрепление. Эти и другие подкрепления называют вторичными. Вторичное подкрепления познаются путем постоянного спаривания с другими существующими подкреплениями. Процесс, при котором ряд подкреплений расширяется, известен как классическое обуславливание.
Некоторые условные подкрепления особенно эффективны, поскольку они могут быть связанными со многими другими подкреплениями. Они называются генерализованным подкреплением. Деньги, жетоны, одобрение и привязанность являются генерализованным подкреплением, так как они могут быть связаны с различными событиями, которые сами по себе являются подкрепляющими.
Основной принцип оперантного обуславливания прост - частота поведения возрастает, если она вознаграждается, и она будет уменьшаться, если такое поведение наказывается. Например, голодная крыса в коробке Скиннера будет в сначала вести себя в манере, которая является естественной для голодных крыс; например, бегать по клетке, пищать, пытаться спастись, и т.д. Если во время выполнения ею этих действий, один ответ - в этом случае, нажатие на рычаг, - приводит к награде обеспечения едой, крыса постепенно узнает, что, нажатие на рычаг приводит к награде пищей. Поведение будет повторяться и, таким образом, выучено. Поведение, которое приводит к награде становится особенно важным для крысы. Тот же самый процесс может быть применен к действию, что позволяет крысе уйти или избежать нежелательных раздражителей.
Другой принцип оперантного обуславливания состоит в том, что как только поведение выучено, частота награды может быть уменьшена. Для научения определённому поведению необходимо сначала подкреплять каждое появление поведения. Когда поведение выучено, с течением времени можно уменьшить частоту подкрепления и по-прежнему вызывать такое же поведение. К примеру, количество нажатий на рычаг для получения подкрепления может изменяться каждый раз, каждые десять раз, или изменить правила таким образом, то что рычаг должен быть нажат непрерывно, и т.д. Бихевиористы провели много экспериментов исследуя какой эффект оказывают различные режимы подкрепления на поведение. Эти режимы подкрепления имеют особое значение для гейм-дизайнера.
Последним из основных принципов оперантного обуславливания является то, что возможно обусловить индивида исполнять определённое поведение за пределами его обычного поведения. Если поведение является особенно сложным, например, это действие, которое требует нескольких шагов, или для его выполнения необходимо особое умение существует вероятность того, что такое поведение невозможно подкрепить напрямую. Вместо этого, можно подкрепить поведение, которое близко к желаемому, и шаг за шагом подкрепляя более похожее поведение на необходимое нам, мы получим желаемое поведение. Этот принцип известен как "формирование поведения". К примеру, видеоигры могут включать в себя различные уровни сложности, и каждый последующий уровень требует, чтобы игрок выполнил более сложный набор действий, чтобы добиться успеха.
.2 Планирование режима подкрепления
Основной принцип оперантного обуславливания гласит: "возможно увеличить частоту поведения подкрепляя его". Изучение оперантного обуславливания становится более интересным, когда мы посмотрим на то, как системы подкрепления могут быть структурированы таким образом, чтобы оказать наибольшее влияние на поведение Ferster, C. B. & Skinner, B. F. "Schedules of Reinforcement", 1957 New York: Appleton-Century-Crofts. Исследователи изучают как подкрепления могут быть выданы, чтобы быть наиболее эффективным.
Существует три типа режима подкрепления - непрерывный, угасающий и периодический. В непрерывном каждое повторение поведения покрепляется, угасающий является противоположностью непрерывного. Как правило, угасание часто вызывает гнев и разочарование со стороны субъекта. Мы ожидаем, что Вселенная имеет смысл и цель быть последовательной, и при появлении непредвиденных обстоятельств мы можем вспылить. Интересно, что эта реакция также наблюдалась и у многих животных. Это называется "поведенческий контраст". В одном из экспериментов шимпанзе выполняли простое задание - потянуть за рычаг. Выполнив его, шимпанзе вознаграждались кусочками листьев салата, который они любят употреблять в пищу. После выполнения серии проб шимпанзе 1 раз вознаграждали виноградом, который они любят ещё больше чем листья салата. Далее, при следующей пробе, их опять награждали листьями салата, и они были очень огорчены этим, бросая салат в экспериментатора. Новый стимул, более приятный чем предыдущий создает новые ожидания от награды, и когда эти ожидания не оправдываются, (у животных) неизбежно наступает фрустрация и гнев. Подобные эксперименты проводились на голубях, и многих других животных. Между этими двумя экстремумами лежит периодический режим, что только некоторые из повторений поведения подкрепляются. Периодический режим подкрепления включает в себя:
Режим соотношения: в этом режиме подкрепление появляется если поведение осуществляется Х раз. Х может быть вариативным числом.
Интервальный режим - в этом режиме первая реакция в любое время по истечении определенного промежутка времени подкрепляется.
Режим длительности - в этом режиме поведение должно происходить на протяжении какой-либо длительности времени чтобы подкрепиться.
Все эти графики подкрепления могут быть фиксированными или вариативными. В фиксированном графике подкрепление будет появляться в течении заданного периода времени, или после фиксированного числа ответов. В вариативном графике подкрепления, время или количество ответов будет меняться вокруг определенного числа; например, подкрепление будет даваться когда действие будет выполнено от 10 до 20 раз. Если мы примем, что постоянный режим и угасающий режим подкрепления являются ничем иным как двумя экстремумами периодического режима то мы получаем восемь базовых режимов подкрепления Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266. В примерах режимов подкрепления значительное внимание уделяется примерам как из реальной жизни, так и в игровой среде.
Фиксированное соотношение - подкрепление дается после точно определенного количества верных ответов. На рис. №1 изображен график динамики поведения животного в режиме фиксированного соотношения. Полосы перекрывающие линию динамики поведения означают момент получения подкрепления. Буквой А отмечена пост-подкрепляемая пауза (Bernstein, Roy, Srull, & Wickens, 1991; Bootzin, Bower, Crocker, & Hall, 1991)[13].
Примеры:
Работа на фабрике, оплачиваемая по количеству произведённых деталей.
Получение премии на работе на каждые (х) проданных товаров.


Сбор жетонов в игре. Многие игры требуют от игрока сбора определенного количества жетонов для перехода на следующий уровень, чтобы получить дополнительное очко жизни, или другое подкрепление.

Достижение нового уровня в RPG - ролевой игре (или "РПГ"). Некоторые RPG показывают в точности, сколько требуется опыта для достижения нового уровня. Высокий показатель определенности того, сколько потребуется работы для достижения нового уровня, заключает игрока в режим фиксированного соотношения подкрепления.
Вариативное соотношение - подкрепление дается после заданного количества верных ответов.
На рисунке №2 изображен график динамики поведения животного в режиме вариативного соотношения. Полосы перекрывающие линию динамики поведения означают момент получения подкрепления.
Примеры:
Игровые автоматы в казино. [13].
Покупка лотерейных билетов (Pettijohn, 1992).
Поочерёдное закидывание и сматывание удочки перед тем как поймать рыбу. Bootzin, Bower, Crocker, & Hall, 1991;
Сбор жетонов. Некоторые игры требуют от игрока собирать жетоны чтобы чего-то достичь, но варьируют количество требуемых жетонов.
Получение нового уровня в РПГ. Некоторые РПГ не дают точной информации о том, сколько требуется опыта для достижения следующего уровня. Это заключает игрока в режим вариативного соотношения подкрепления.
Крафтинг (производство каких-либо вещей или экипировки самим игроком) в РПГ. Может потребоваться множество попыток, чтобы достичь успеха, и чтобы вещь получила новый уровень, но чем больше раз вы пытаетесь, тем более вероятно что ваше поведение подкрепится.

Фиксированный интервал - первый ответ после фиксированного временного интервала подкрепляется.
На рис. №3 изображен график динамики поведения животного в режиме фиксированного...

Похожие материалы:

Курсовая работа: Влияние темпераментальных особенностей личности на поведение в конфликте

Курсовая работа: ЦЕННОСТНЫЕ ОРИЕНТАЦИИ ЛИЧНОСТИ И ИХ ВЛИЯНИЕ НА ПОВЕДЕНИЕ ЧЕЛОВЕКА

Реферат: Влияние глутамата натрия на обмен веществ и поведение

Курсовая работа: Влияние последствий стресса на организационное поведение

Курсовая работа: Влияние дефектов социализации на конфликтное поведение подростка