Тема 1.
Предмет и методы психологии
Практика
Роберт Готтсданкер
|
|
|
Рис. 2.1. Понедельная производительность труда испытуемой Д. Ось абсцисс — очередность недель проведения эксперимента. Ось ординат — количество пропущенных ударов (в среднем за час). Пунктирная линия — работа без наушников, сплошная — с наушниками |
Рис. 2.2. Время реакции выбора для 70 последовательных проб. Ось абсцисс — номера проб (пунктиром отмечен период отдыха). Ось ординат — время реакции (в мс). Пунктирная линия — сдвиг рукоятки к себе, сплошная — от себя; треугольниками помечены ответы с ошибками |
Таким образом, в исследовании времени реакции были обнаружены поминутные и даже посекундные его изменения. Они не связаны с усталостью, скорее их можно объяснить колебаниями внимания. На графике результатов ткачихи Д. отражены значительные колебания производительности ее труда. При этом взлеты и падения кривых, по-видимому, не зависят от температуры и влажности. Правда, увеличение числа пропущенных ударов к окончанию эксперимента можно объяснить применением искусственного (газового) освещения; оно было необходимым, так как эксперимент заканчивался осенью.
Даже тогда, когда сами ответы испытуемых постоянны, изменения могут вноситься процедурой их измерения. Счетчик фиксирует каждое передвижение челнока, совершающего новый удар. Однако приборы не всегда бывают исправны. А если измерения связаны с субъективными суждениями, то они непременно окажутся менее стабильными. Джек считал пьесу выученной окончательно после двух безошибочных исполнений наизусть. Однако в исполнении пьес было довольно много небольших погрешностей, почти ошибок. Иногда Джек мог посчитать их ошибками, а иногда нет. И объяснилось это вполне естественными колебаниями его субъективного состояния. Изменения в оценке исполнения пьес могли быть и регулярными. Например, в процессе эксперимента Джек мог все строже относиться к своим ошибкам.
Одну и ту же пьесу нельзя заучить (как в идеале) двумя различными методами одновременно. Но даже если методы следуют один за другим, их все равно нельзя применить к одной и той же пьесе. Если пьеса заучена, она заучена. Существуют эксперименты, в которых необходимо не только предъявлять разные экспериментальные условия в разное время, но и менять трудность задач. Это весьма значительное отличие от идеального эксперимента. Как Джек может убедиться в одинаковой трудности выбранных им пьес? А ведь в любом эксперименте по исследованию научения с участием одних и тех же испытуемых задачи для разных условий независимой переменной с необходимостью будут разными.
В неудачном варианте своего эксперимента Джек сначала заучивал две пьесы частичным методом, а затем две другие — целостным. Мы уже знаем, что на качество его игры могут повлиять любые (в том числе только что описанные) факторы, изменяющиеся во времени. Однако есть и другие влияния, связанные с положением каждого из условий независимой переменной в последовательности их предъявления. Влияния одного из условий на следующие за ним называются эффектами последовательности, эффектами порядка или эффектами переноса. Они могут быть положительными и отрицательными, иметь общий и специфический характер. Применение частичного метода могло положительно повлиять на дальнейшие занятия Джека по целостному методу за счет увеличения практики или привыкания к режиму эксперимента. Оно могло оказать и отрицательное действие: привычка заучивать пьесы короткими отрывками могла помешать заучиванию больших частей или Джек мог просто устать от занятий.
Во времена возникновения автомобиля бытовал такой анекдот в форме загадки. Вопрос: Какой самый главный винтик в автомобиле? Ответ: Тот, что держит руль.[1] В том же духе можем спросить и мы. Вопрос: Какой из факторов, угрожающих валидности эксперимента, самый опасный? Ответ: Экспериментатор.
Если у исследователя есть какие-либо ожидания относительно результатов эксперимента, особенно связанные с предпочтением одного из условий независимой переменной, то эти ожидания так или иначе проявятся при проведении опытов, Йоко хорошо знала, что главное — это составить случайную последовательность обоих сортов сока. Ей хотелось исключить любой намек на то, какой именно сорт она оценивала каждое утро. А вот Джек не проявил должной аккуратности. Сначала он подобрал пары пьес, которые казались ему одинаковыми по трудности (с тем, чтобы разучивать каждую из пьес разными методами), а затем сам расположил их в определенной последовательности. Но если при этом он рассчитывал на большую эффективность частичного метода, то мог невольно отобрать для целостного метода более трудные пьесы из каждой пары.
Кроме того, субъективные оценки качества исполнения пьес могли колебаться не случайным образом (как было показано выше). Джек мог невольно отдавать предпочтение одному из методов. Поэтому при оценке исполнения обеих пьес каждой пары Джеку не следует слишком верить в частичный метод, но и применяя целостный, тоже стараться достичь самых высоких результатов.
В эксперименте с наушниками исследователи, естественно, рассчитывали повысить с их помощью производительность труда и вполне могли передать свою уверенность участникам эксперимента. Поэтому, возможно, с наушниками ткачихи (в среднем) старались работать лучше.
Одно из самых коварных следствий предубежденности экспериментатора — это нежелание учитывать некоторые экспериментальные данные, как полученные якобы при нетипичных условиях, например при сильном уличном шуме. К сожалению, мнение экспериментатора о нетипичности условий часто весьма субъективно. Отсюда один и тот же уровень шума будет считаться нетипичным при одном состоянии независимой переменной, но вполне нормальным — при другом.
От предубеждения экспериментатора может зависеть даже точность регистрации данных. Показано, например, что в протоколах экспериментов по изучению экстрасенсорного восприятия встречаются ошибки в пользу наличия соответствующих феноменов, если протоколист верит в их существование. Те же, кто не верит в экстрасенсорное восприятие, не допускают подобных искажений (Кеннеди, 1939). Тщательный анализ этой проблемы в целом представлен в книге "Влияния экспериментатора в психологическом исследовании" (Розенталь, 1976).
Термин «контроль» используется в нашей книге для обозначения любого способа усовершенствования экспериментов, который приближает их к безупречному. Здесь мы будем иметь дело с угрозами внутренней валидности эксперимента и мерами, которые позволяют их устранить. Если контроль в эксперименте недостаточен, то внутренняя валидность может нарушиться двояким образом. Она может пострадать от ненадежности и от систематического смешения. Ниже мы рассмотрим способы первичного контроля (применимые к любой экспериментальной схеме), которые могут повысить надежность эксперимента и сократить систематическое смешение.
Предположим, что исследование в ткацком цехе проводилось лишь в течение 11-й и 14-й недель из 26. Для выбора, в какую из этих недель давать наушники, просто бросали монету (чтобы избежать предубеждений) Случилось так, что выбор пал на четырнадцатую неделю. А теперь посмотрите на рис 2.1. На этой неделе испытуемая Д. работала плохо: она пропускала более 1400 ударов за час. С другой стороны, одиннадцатая неделя была для нее удачной: менее 800 пропущенных ударов за час Объективность такого эксперимента сомнений не вызывает, он просто слишком короткий За две другие недели ткачиха покажет иные результаты и т д. Двухнедельный эксперимент весьма далек от бесконечного, а 26-недельный гораздо ближе к нему, и у нас есть все основания надеяться, что другой эксперимент в 26 недель даст примерно те же результаты Конечно, если разброс будет невелик, то большего количества проб не потребуется.
Когда мы говорим о надежности среднего значения зависимой переменной для каждого из условии независимой переменной, то имеем в виду его устойчивость при повторении эксперимента второй, третий, четвертый и т.д. раз. Итак, если надежность высокая, то при многократном повторении эксперимента будет воспроизводиться примерно одно и то же значение зависимой переменной.
Выбор адекватного количества проб. Для достижения высокой надежности эксперимента количество проб должно соответствовать изменчивости изучаемого поведения. В эксперименте с временем реакции, как можно судить по рис. 2.2, требуется много проб — 50, 100 или даже больше. Ведь экспериментальные данные сильно варьируют от пробы к пробе. Джеку Моцарту в эксперименте с заучиванием фортепьянных пьес проб нужно гораздо меньше, поскольку каждая проба включает довольно много отдельных действий, и результат измерения оказывается более стабильным. Таким образом, необходимое количество проб зависит от разброса результатов измерений.
Сокращение изменчивости во времени. Увеличение количества проб — лишь один из способов повышения надежности. Другой — сокращение самой изменчивости изучаемого поведения. Достигается оно прежде всего с помощью организации хода эксперимента и его протоколирования, уже обсуждавшихся в главе 1. Процедура эксперимента должна строго соблюдаться, а значимая информация о ней (учитывая возможность ошибок при воспроизведении по памяти) — фиксироваться документально. Кроме последовательного выполнения запланированных действий уменьшения разброса экспериментальных данных можно достичь, соблюдая точность в эксперименте.
Любые меры, которые позволяют сделать эксперимент более точным, сокращают изменчивость поведения во времени. Так, чтобы не увеличивать эту изменчивость за счет поведения экспериментатора, везде, где это возможно, применяются автоматические методы. Например, в эксперименте с временем реакции выбора экспериментатор сам мог бы давать испытуемому команду «Приготовьтесь!» примерно за секунду до предъявления сигнала. Разумеется, время подачи такой команды, громкость голоса экспериментатора не могут не изменяться. Поэтому гораздо лучше использовать для предупреждения испытуемого прибор-автомат, зажигающий стандартную световую точку. Далее, экспериментатор мог бы измерять время реакции с помощью обычного секундомера: включать его при предъявлении сигнала и останавливать, увидев, что испытуемый дал ответ. Но это, несомненно, увеличило бы различие между пробами. Использование же электрических или электронных часов, которые автоматически включаются вместе с сигналом и останавливаются с выдачей ответа, позволяет практически предотвратить подобные вариации
Из сказанного вполне понятно, что любые способы стабилизации побочных переменных повышают надежность эксперимента. Джеку Моцарту, конечно, не следует во время своих занятий то закрывать окна, то широко раскрывать их. Если у него есть возможность поддерживать в комнате нормальную температуру, то окна лучше всегда держать закрытыми, чтобы уменьшить шум транспорта и, что более важно, сократить колебания в уровне этого шума. Мы помним, как внимательно следила Йоко за тем, чтобы томатный сок, который она пила, имел постоянную температуру.
Систематическое смешение
Однако на самом деле ненадежность — еще не самый худший вариант нарушения внутренней валидности. В принципе этот недостаток всегда можно исправить путем увеличения числа проб. В тех же случаях, когда этого сделать нельзя, мы используем термин «систематическое смешение». План «неудачного» эксперимента с ткачихами — работа в первые 13 недель с наушниками и следующие 13 без них — не позволяет улучшить эксперимент путем увеличения количества проб. Можно повторить эксперимент полностью, но и тогда останется сомнение, не пришелся ли один из этих 13-недельных периодов на времена, когда зависимая переменная испытывала благоприятные (или неблагоприятные) влияния. Напротив, с помощью плана чередования недель, который применялся в действительности, можно продлить эксперимент настолько, насколько потребуется для достижения надежности. Следовательно, «неудачный» план приводит к систематическому смешению Независимой переменной (использование или неиспользование наушников) с другими факторами, изменяющимися во времени (в первые или вторые 13 недель.
Систематическое смешение означает, что независимая переменная постоянно сопровождается некоторыми побочными переменными. Использование наушников сопровождается изменениями в состоянии ткачихи за первые 13 недель, их неиспользование — изменениями в ее состоянии за вторьте 13 недель. По данным такого эксперимента мы не сможем судить о том, была ли высокая производительность труда (за первые 13 недель) результатом воздействия независимой переменной (использования заглушек) или каких-то других факторов.
Теперь нам понятно, почему описанный эффект (в отличие от ненадежности) назван систематическим. Надежность можно повысить, увеличивая число проб, ведь в течение долгого времени любые благоприятные (или неблагоприятные) влияния окажутся размытыми. Если же эксперимент страдает от систематического смешения, то—с увеличением проб этот недостаток лишь—усугубится.
Довольно много подобных влияний может возникнуть в случае, если не принять необходимых мер против предубеждений экспериментатора. Если экспериментаторы надеялись на повышение производительности труда с помощью наушников, то они могли передать свою веру рабочим, а быть может, и ошибаться в снятии показаний счетчика ударов. Все это явно нарушило бы равновесие между двумя состояниями независимой переменной. Одно из этих состояний (использование наушников) сопровождалось бы одним уровнем побочной переменной — благоприятным предубеждением экспериментатора, а второе состояние (неиспользование наушников)—другим ее уровнем — неблагоприятным предубеждением. При этом экспериментатору вовсе не обязательно проявлять свои склонности постоянно. Даже эпизодические случаи будут порождать систематические влияния, приводящие к неравенству двух состояний независимой переменной.
Довольно много подобных влияний может возникнуть в случае, если не принять необходимых мер против предубеждений экспериментатора. Если экспериментаторы надеялись на повышение производительности труда с помощью наушников, то они могли передать свою веру рабочим, а быть может, и ошибаться в снятии показаний счетчика ударов. Все это явно нарушило бы равновесие между двумя состояниями независимой переменной. Одно из этих состояний (использование наушников) сопровождалось бы одним уровнем побочной переменной — благоприятным предубеждением экспериментатора, а второе состояние (неиспользование наушников) — другим ее уровнем — неблагоприятным предубеждением. При этом экспериментатору вовсе не обязательно проявлять свои склонности постоянно. Даже эпизодические случаи будут порождать систематические влияния, приводящие к неравенству двух состояний независимой переменной.
В описанных нами исследованиях разные состояния, или условия, независимой переменной давались одному и тому же испытуемому. Каждый раз реальный эксперимент отличался от идеального тем, что условия давались испытуемым в разное время. Следовательно, в эксперименте нужно каким-то образом контролировать довольно большое количество факторов, которые можно объединить под названием «факторы времени». Для этой цели есть практически только три схемы последовательного предъявления условий, которые нам нужно подробно обсудить. Такие схемы, как предъявление сначала всех проб одного условия, а затем — всех проб второго условия, вроде «неудачного» эксперимента с наушниками, нас вообще не интересуют. Три экспериментальные схемы — это те, что применялись в трех экспериментах из главы 1: случайная последовательность условии эксперимент с томатным соком), их регулярное чередование (наушники) и позиционно уравненная последовательность (заучивание фортепьянных пьес). Сейчас мы разберем основания для применения каждой из этих схем и обсудим, насколько успешно они позволяют контролировать факторы времени.
Эта схема особенно хороша для тех экспериментов, где сами пробы достаточно коротки, но в интересах надежности их используется довольно много. В тех случаях, когда испытуемый не должен знать о состоянии независимой переменной в каждой данной пробе, как в эксперименте Йоко, схема случайной последовательности единственно возможна.
Как следует из самого названия схемы, состояния, или условия, независимой переменной предъявляются в случайном порядке. Бросают, скажем, игральную кость и смотрят, на какое число точек (четное или нечетное) она выпала. Если сравниваются два условия, то выпадению нечетного числа мажет соответствовать условие А, а четного—условие Б. Если количество проб для каждого из условий должно быть одинаковым, то можно распределить их так, как это сделала Йоко,— воспользоваться равным количеством бумажных бланков для того и другого условия. Более строгий способ составления случайной последовательности будет изложен в главе 4.
При использовании этой схемы исключается всякая возможность систематического смешения независимой переменной с факторами времени, поскольку в случайной последовательности никакой системы не существует. С увеличением проб повышается надежность эксперимента.
Нам понятно, почему в исследовании с наушниками экспериментаторы использовали регулярное чередование условий, а не их случайную последовательность. Они не знали, сколько времени фабрика будет выпускать один и тот же вид ткани, и хотели, чтобы число недель работы с наушниками и без них было одинаковым. Если распределять условия случайно, работа с наушниками могла начаться, скажем, лишь на 10-ю неделю из первых 15. Кроме того, если с течением времени в самочувствии оператора, состоянии станка, влажности воздуха и т. п. происходили систематические изменения, то одно из условий, более часто попадающее в первую (или вторую) половину эксперимента, могло иметь преимущество перед другим. Поэтому для достижения надежности здесь нужно регулярное чередование, а не случайная последовательность.
Данную схему можно использовать при проведении эксперимента с большим числом проб, если только эти пробы не обязательно распределять случайно (чтобы усреднить влияния факторов времени). А вот в эксперименте Йоко никакой регулярной схемы применить было нельзя: нужно было избежать влияния пристрастности испытуемой к одному из экспериментальных условий.
У схемы регулярного чередования есть только один небольшой недостаток. Что если бы в каждую вторую неделю эксперимента происходило некоторое событие, скажем, очередная наладка станка? Это привело бы к систематическому смешению независимой переменной, которое благоприятствовало бы одному из ее условий, следующему сразу же за этим событием. Напротив, при случайном распределении условий любые влияния факторов времени можно компенсировать, увеличивая продолжительность эксперимента. Ведь для этой схемы более актуален вопрос о ненадежности, чем о систематическом смешении с побочными факторами.
Позиционно уравненная последовательность условий применяется в тех случаях, когда экспериментатор по той или иной причине не использует большого количества проб (или блоков проб). Именно таким был случай Джека Моцарта. Джек хотел найти более эффективный метод заучивания достаточно быстро, не разучивая в эксперименте слишком много пьес. Поэтому здесь позиционно уравненная последовательность состояла только из четырех проб — АББА (целостный—частичный— частичный—целостный). Аналогично, если экспериментатору нужно сравнить время реакции на появление звуковых и световых сигналов, он мог бы составить последовательность из четырех блоков по 50 проб в каждом. Во всех пробах каждого блока применялся бы либо только звук, либо только свет. Тогда в позиционно уравненной последовательности АББА: звук— свет—свет—звук — каждую позицию занимала бы не отдельная проба, а целый их блок.
При использовании данной схемы, так же как и двух других, надежность эксперимента зависит от количества проб. Мы имеем в виду либо количество отдельных действий, входящих в одну пробу, либо число самих проб в блоке. А как обстоит дело с систематическим смешением независимой переменной? Если в эксперименте применяется схема позиционного уравнивания, то оба условия следуют в среднем через одинаковые временные промежутки. Это позволяет контролировать любые изменения во времени, которые имеют линейный характер. Как отмечалось ранее, в последовательности из четырех проб в эксперименте Джека каждое условие занимало в среднем позицию 2,5. Если предположить, что все возможные изменения нарастают по прямолинейной функции, то данная схема позволяет их хорошо контролировать. Например, если бы с исполнением каждой новой пьесы Джек становился все более сосредоточенным и уровень его внимания возрастал каждый раз на 4 условные единицы, то влияния данного фактора времени оказались бы контролируемы. Скажем, при разучивании первой пьесы уровень внимания Джека имел значение 90, при разучивании второй—94, третьей—98 и четвертой—102. Среднее значение для условия А (пробы 1 и 4) составило бы 96 и среднее для условия Б (пробы 2 и 3) —тоже 96.
Для проверки предположения о прямолинейном характере происходящих изменений нам стоит еще раз посмотреть на рисунки 2.1 и 2.2. Эти изменения совершенно бессистемны и непредсказуемы. Из них можно заключить, что сосредоточенность Джека возрастала от пробы к пробе: на 5 единиц, на 2 и на 1. Тогда ее значения для каждой из четырех проб будут следующими: 90, 95, 97 и 98. Среднее для условия А (90 и 98) составит 94, в то время как для условия Б (95 и 97)— 96. Указанная схема не позволит уравнять влияния факторов времени для обоих экспериментальных условий. В результате возникнет систематическое смешение независимой переменной с этими побочными влияниями.
Вы помните, что если бы Джек смог провести идеальный эксперимент, он заучивал бы одну и ту же пьесу двумя разными методами. Поскольку это невозможно, то самое лучшее — найти пару пьес, одинаковых по трудности. Такая проблема возникает в любом эксперименте, где из-за влияния научения для разных экспериментальных условий нужно использовать разный материал, т. е. разные задачи. Давайте посмотрим, как можно уравнять влияния факторов, связанных с различием задач (или, короче, факторов задачи), с помощью трех указанных схем, в том числе схемы позиционного уравнивания, которой пользовался Джек.
Начнем с того, что здесь понадобились бы не четыре пьесы, а гораздо больше, пожалуй, даже слишком много, чтобы реализовать эту схему на практике. Предположим, однако, что такой эксперимент можно осуществить. Тогда есть две стратегии подбора различных пьес (задач). Первая — это выбрать для заучивания 30 или 40 пьес и затем расположить их в случайном порядке. Название каждой пьесы можно записать на бланке, положить бланки в коробку, а затем выбирать их случайным образом. Иначе говоря, случайную последовательность пьес можно получить так же, как и случайную последовательность условий независимой переменной. Другая стратегия заключается в разделении пьес на пары по степени их трудности. Если всего отобрано 30 пьес, то сначала составляют пару из двух самых трудных пьес, затем из двух, следующих за ними по трудности, и т. д., получая таким образом 15 пар. В каждой паре путем случайного выбора, т. е. бросая монету, определяют, какая пьеса будет заучиваться каждым из методов. Затем пары можно расположить в порядке возрастания трудности и приступать к заучиванию, начиная с самой легкой пары. Пьесы, отобранные для каждого метода, можно распределить и случайно. Однако при этом влияние разного уровня трудности задач усилится за счет влияния временных изменений, точнее, факторы задачи просто войдут в состав факторов времени. Если пьесы сильно различаются по трудности, то для достижения надежности эксперимента потребуется большое количество проб, но зато не будет никакого систематического смешения.
Поскольку эта последовательность используется в экспериментах с несколько меньшим количеством проб,. то следует применять не простое случайное распределение по каждому из методов, а с предварительным разделением пьес на пары. Разучивание лучше всего начинать с двух самых легких пьес, затем переходить к двум несколько более трудным и т. д. При слишком большом различии заданий, снижающем надежность эксперимента, также следует увеличить количество проб. Здесь систематическое смешение независимой переменной с факторами задачи будет отсутствовать.
Если экспериментатор использует только одну серию позиционно уравненной последовательности АББА, как это было у Джека, решающую роль играет подобие пьес в каждой паре. Сначала Джек попытался отобрать для каждого метода две длинные и две короткие пьесы. Затем он составил пары пьес, практически одинаковых по трудности. И все же ему не стоило самому принимать решение о том, каким методом заучивать ту или другую пьесу. Для каждого метода он должен был случайно выбрать по пьесе из обеих пар. Тогда он избежал бы невольного отбора более легких пьес для предпочитаемого им метода. Однако, принимая свое решение, Джек не мог иметь точного представления о трудности пьес, поэтому его выбор можно считать удовлетворительным. Но так или иначе, систематического смешения независимой переменной с факторами задачи в данном случае избежать нельзя. Насколько оно серьезно — зависит от того, в какой мере подтвердится предположение о подобии пьес. Экспериментатору всегда стоит стремиться отбирать такие задачи, которые можно как-то измерить. А это очень непросто. Было показано, например, что даже наборы бессмысленных слогов могут различаться по своей семантике и трудности заучивания.
Важность этой проблемы все более осознается в экспериментальной психологии (Поултон и Фримен, 1966). Сейчас мы обсудим, почему эффекты последовательности — 80это основной фактор, нарушающий внутреннюю валидность в эксперименте с одним испытуемым. Речь идет о тех характеристиках ответа испытуемого в данной пробе, которые вызваны самим фактом предъявления ему предыдущих проб. Эти влияния могут быть положительными и отрицательными. Они могут иметь глобальный характер, как, например, адаптация к режиму эксперимента или усталость испытуемого. Они могут быть и специфическими, скажем, умение предсказывать тот момент, когда в челноке окончится нить. Они бывают недолгими, распространяющимися лишь на одну последующую пробу, и продолжительными, причем их действие от пробы к пробе может накапливаться. Такие влияния обычно называются эффектами переноса.
Рассмотрим эффект переноса, который накапливается по мере предъявления проб. Предположим, что в течение четырех экспериментальных проб (целостный метод—частичный—частичный—целостный) Джек Моцарт постепенно втягивался в режим эксперимента. Если подобное влияние на каждую последующую пробу является однородным, то ни один из методов заучивания не получит преимущества перед другим. Например, если величина положительного переноса каждой предыдущей пробы (или переноса от пробы к пробе) равна 2 «единицам», то значения «помощи» испытуемому были бы следующими: первая проба целостного метода — никакой помощи, первая частичного метода — 2 единицы, вторая частичного метода — 4 единицы, вторая целостного метода — 6 единиц. В итоге на каждый метод, целостный и частичный, пришлось бы по 6 единиц. Таким образом, эффект однородного переноса оказывается уравновешенным.
Однако чаще случается так, что процесс научения сначала протекает более интенсивно, а затем замедляется. Поэтому в нашем примере лучше предположить, что перенос первой пробы на вторую равнялся 3 единицам, от второй к третьей пробе он возрастал на 2 единицы, 81а от третьей к четвертой—только на 1. При таком неоднородном переносе каждой пробе отвечали бы следующие значения: первая проба целостного метода— никакой помощи, первая частичного метода — 3 единицы, вторая частичного метода — 5 единиц, вторая целостного метода — 6 единиц. Теперь целостный метод по-прежнему получает в итоге 6 единиц, в то время как частичный — 8.
При использовании позиционно уравненной последовательности АББА условия независимой переменной (А или Б) оказываются связанными с ранним-или-поздним переносом. Условие А связано с поздним переносом, поскольку оно получает «помощь» только на четвертой пробе, а условие Б—с ранним, на второй и третьей пробах. Внутренняя валидность эксперимента пострадает в той мере, в какой предположение об однородности переноса окажется неверным. Приведенное объяснение справедливо не только в случае положительного, но и отрицательного эффекта последовательности,. например по причине усталости испытуемого. Только в этом случае преимущество получает условие А.
При использовании схем случайной последовательности и регулярного чередования, когда число проб достаточно велико, проблема неоднородных влияний далеко не так существенна, как при позиционно уравненной последовательности. Ведь каждое из условий независимой переменной проходит в эксперименте по нескольку раз, как в ранних, так и в поздних пробах. Гораздо большую опасность для достижения внутренней валидности при использовании любой из трех рассмотренных схем представляют асимметричные влияния.. Обратимся к их описанию.
Если мы уверены в том, что в нашем эксперименте с одним испытуемым эффекты последовательности являются симметричными, то связанные с ними трудности можно преодолеть. Посмотрим, почему это так и что 82означает в данном контексте слово «симметричные». Оно означает, что влияние условия А на последующее условие Б является точно таким же, как и влияние условия Б на последующее условие А. Скажем, использование частичного метода занятий в эксперименте Джека Моцарта точно так же влияет на последующее применение целостного метода, как использование целостного метода на последующее применение частичного.
Предположим, что между двумя методами существует своего рода антагонизм, т. е. негативный перенос, равный 5 единицам. При последовательности методов: целостный—частичный—частичный—целостный — его эффект обнаружится на второй и на четвертой пробах, т. е. на второй (частичный метод) и четвертой (целостный) пробах эффективность заучивания пьес будет снижаться на 5 единиц. Таким образом, при позиционно уравненной последовательности, которой воспользовался Джек, эти симметричные влияния взаимно компенсируются. При большем количестве проб (в случайной или чередующейся схемах) условие А предшествует условию Б, а Б предшествует А примерно одинаковое число раз, и поэтому их взаимовлияния вновь будут уравнены.
Но если перенос условия А на условие Б отличается от влияния Б на А, то экспериментатор оказывается в весьма затруднительном положении. Предположим — и это самый худший случай,—что практика, получаемая при использовании целостного метода, облегчает Джеку разучивание пьес с помощью частичного метода, а практика, получаемая при частичном методе, мешает заучиванию с помощью целостного. Пусть, как и раньше, эти влияния равны 5 единицам. При последовательности АББА качество исполнения пьес повысится на 5 единиц на второй пробе (частичный метод) и понизится на 5 единиц на четвертой пробе (целостный метод). Ясно, что эффекты переноса скомпенсированы не будут, и частичный метод получит преимущество. Для того чтобы это произошло, вовсе не обязательны разнонаправленные влияния, им достаточно быть просто неодинаковыми по величине. В данном случае мы имеем дело с систематическим смешением независимой переменной (метод заучивания) с другой переменной — последовательностью проб: либо условие А—условие Б, либо условие Б—условие А. Одна из проб условия А сопровождается влиянием Б на А, а одна из проб условия Б — влиянием А на Б. И беда в том, что экспериментатор не знает, какой вид влияния имеет Место. Все, что у него есть, — это четыре показателя качества исполнения пьес, на каждое из которых воздействуют к тому же факторы времени, а иногда (как в данном эксперименте) —еще и факторы задачи,.
Не слишком изменится эта ситуация и при регулярном чередовании проб. Каждая проба условия Б следует за пробой условия А и наоборот. Если влияния асимметричны, то систематическое смешение независимой переменной будет не в половине проб, как в схеме позиционного уравнивания, а в каждой пробе (кроме первой). И вновь нет практически никаких средств для определения асимметричности этого переноса.
При использовании случайной последовательности примерно половина проб одного условия предшествует пробам другого условия. Возникает хоть какая-то возможность определить само наличие влияний последовательности и их асимметричный характер. Например, для каждого из следующих сочетаний проб: условие А предшествует условию Б, А не предшествует Б, Б предшествует А, Б не предшествует А — можно получить отдельное значение зависимой переменной. Различие между первыми двумя значениями позволит обнаружить величин влияния условия А на условие Б, а различие между двумя вторыми значениями — величину влияния Б на А. Зная эти величины, можно позаботиться об устранении систематического смешения: определяя значения зависимой переменной при каждом из условий, нужно вычитать соответствующие величины эффектов последовательности.
Следует заметить, что наше обсуждение не дает полного представления о последствиях предъявления обоих условий независимой переменной одному и тому же испытуемому. Здесь возможны влияния более общего характера. Например, целостный метод заучивания может становиться менее эффективным только в сочетании с частичным. По контрасту он может показаться испытуемому слишком утомительным. А если бы применялся один метод, контраста бы не было. Для определения подобных влияний также нет никаких практических средств. Кроме того, в эксперименте с одним испытуемым ни одна из указанных схем не устраняет возможности асимметричного переноса. Именно эти влияния следует признать самым серьезным источником систематического смешения независимой переменной.
Более того, он является и наиболее общим видом систематического смешения. Если между двумя условиями независимой переменной существуют асимметричные эффекты последовательности, то они скажутся в любом эксперименте, сравнивающем эти условия. Влияние предубеждений экспериментатора будет сказываться только в данном конкретном эксперименте, в другом эксперименте оно может радикально измениться, если новый экспериментатор имеет противоположные предубеждения. Точно так же смешение с факторами времени и факторами задачи при использовании короткой позиционно уравненной последовательности будет существенно меняться от эксперимента к эксперименту, как и неоднородные эффекты последовательности.
Мало иметь заранее подготовленный цлан эксперимента и хорошо регистрировать его ход. Не всякий план является удачным. Реальный эксперимент можно оценить по его близости к эксперименту безупречному. Конечно, на практике безупречность недостижима. Значение идеи безупречного эксперимента состоит в том, что она дает образец для оценки реальных экспериментов и точного определения их недостатков. В данной главе мы пользовались этим образцом при сравнении экспериментов, описанных в главе 1, с менее удачными планами проведения тех же экспериментов.
Одним из видов безупречного эксперимента является идеальный эксперимент, в котором одному и тому же испытуемому в одно и то же время предъявляются разные условия независимой переменной. Главное в нем — это обеспечение неизменности всех побочных факторов. Другим видом безупречного эксперимента является бесконечный, т. е. постоянно продолжающийся, эксперимент. Центральное значение имеет здесь достаточно большое количество данных. Третий вид безупречного эксперимента — эксперимент полного соответствия, все обстоятельства проведения которого суть те же самые обстоятельства, на которые будут распространяться его выводы. В нем важно то, что дополнительные факторы нужно сохранять не просто на неизменном, но и на адекватном уровне. При сравнении первоначально описанных экспериментов с их менее удачными вариантами было обнаружено, что во всех случаях оригинальные планы были ближе к одному из видов безупречного эксперимента.
В любом реальном эксперименте не все полученные данные можно считать достоверными. Однако нужно стремиться получить результаты (основу для будущих выводов), как можно более близкие к результатам безупречного эксперимента. Чем ближе реальный эксперимент к безупречному, безошибочному и по плану, и по процедурам, тем лучше он репрезентирует, или представляет его. Во всех случаях сравнения оригинальных экспериментов с их менее удачно спланированными вариантами оказалось, что именно оригинальные лучше представляют безупречный эксперимент. В зависимости от того, насколько реальные эксперименты репрезентируют безупречный, они бывают более или менее валидными. Различают два вида валидности. Первый называется внутренней валидностью. Речь идет о таком планировании эксперимента, при котором можно получить то же отношение между независимой и зависимой переменными, что и в идеальном или бесконечном экспериментах, т. е. об устранении побочных влияний. Если же эксперимент по своему проекту позволяет получить те же результаты, что и эксперимент полного соответствия, то он обладает внешней валидностью. Эксперимент, страдающий недостатком внутренней валидности, можно назвать неудачным, несостоятельным, а эксперимент, которому недостает внешней валидности, — неадекватным. Примером последнего служит эксперимент, при проведении которого уровень значимой Дополнительной переменной не соответствует ее реальному уровню. Было установлено, наконец, что даже когда эксперимент удачно спланирован и успешно проведен, нет полной гарантии того, что полученные в нем результаты подобны результатам безупречного эксперимента. И наоборот, неудачно спланированный эксперимент может дать корректные результаты. Хотя, конечно, у хорошо спланированного эксперимента таких шансов больше.
Особое внимание в этой главе мы уделили внутренней валидности — главному требованию к любому эксперименту. Существует Целый ряд факторов, затрудняющих достижение внутренней валидности. В эксперименте с одним испытуемым это прежде всего всевозможные изменения, происходящие с течением времени. Идеальный эксперимент неосуществим, нельзя одновременно предъявить одному и тому же испытуемому различные условия независимой переменной. На практике двух идентичных проб не существует, независимо от того, предъявляются они одному испытуемому или разным. Это связано, в частности, с теми побочными факторами, уровни которых могут изменяться. Некоторые из этих факторов можно зафиксировать и проконтролировать. Однако в большинстве случаев связанная с ними нестабильность результатов от пробы к пробе неизбежна. Как продолжительные, так и кратковременные колебания такого рода являются скорее правилом, чем исключением. Некоторые из них связаны с непостоянством побочных влияний, которые можно определить, но нельзя проконтролировать. Даже сама независимая переменная не всегда остается неизменной в различных пробах. Непостоянство же зависимой переменной может быть связано также с особенностями изучаемого поведения и с его измерениями в эксперименте. Все эти факторы мы объединили под названием «факторы времени».
Помимо них мы описали еще три источника нарушения внутренней валидности. Некоторые эксперименты, особенно связанные с научением, требуют применения различных задач для разных условий, и тогда «факторы задачи» становятся одним из таких источников. Далее, в любом эксперименте, где разные условия предъявляются одному и тому же испытуемому, существуют эффекты последовательности, т. е. влияния ранее предъявленного условия на предъявленное позже. И еще один источник нарушения внутренней валидности — это предубеждение экспериментатора о преимуществе одного из условий независимой переменной.
Все эти угрозы внутренней валидности в случае их неустранения приведут к одному из двух следствий. Первое — ненадежность эксперимента. Она возникает в том случае, если при большом разбросе данных проведено слишком мало проб. Здесь у нас нет полной уверенности в том, что при повторении эксперимента будут получены те же самые результаты. Второе—систематическое смешение, когда каждое из условий независимой переменной неразрывно связано со своим уровнем одной из других переменных, и это нарушает внутреннюю валидность.
В главе были обсуждены различные схемы эксперимента с одним испытуемым и то, насколько успешно позволяют они устранить указанные недостатки. Какая бы схема ни применялась, неотъемлемой частью эксперимента является первичный контроль за побочными факторами. Это — организация и протоколирование эксперимента, стабилизация известных побочных переменных, точность экспериментальных процедур и необходимое количество проб.
Схема случайной последовательности особенно удобна в тех экспериментах, где для каждого из условий можно применить большое количество проб. Валидность зависит от числа проб, необходимого для достижения высокой надежности эксперимента. Использование этой схемы исключает возможность всех эффектов последовательности, за исключением асимметричных влияний. Впрочем, последние сохраняются и при использовании других схем.
Если в эксперименте можно использовать не так много проб, то лучше предъявлять их не в случайном порядке, а применить схему регулярного чередования. Надежность эксперимента вновь будет зависеть от соответствия количества проб разбросу показателей. Экспериментатору следует обратить особое внимание на возможные влияния событий, происходящих через равные промежутки времени. Эти влияния могут давать определенное преимущество одному из исследуемых условий и, таким образом, приводить к систематическому смешению.
Схема позиционно уравненной последовательности применяется при относительно небольшом количестве проб (или блоков проб). Надежность зависит от адекватности выбора проб или их блоков изучаемому поведению. Здесь контроль за систематическими влияниями факторов, изменяющимися от пробы к пробе, связан с предположением о линейном характере этих изменений.
Схемы различаются также и по тому, насколько успешно они позволяют преодолеть различия задач. При использовании позиционно уравненной последовательности все задачи разделяют на пары, стараясь подобрать в каждую пару задачи примерно одинаковой трудности. Если это не удается полностью, то внутренняя валидность эксперимента пострадает из-за неизбежного для данной схемы систематического смешения независимой переменной с факторами задачи. Если используются случайная последовательность или регулярное чередование условий, т. е. число проб достаточно велико, то задачи (или пары задач) можно предъявлять в случайном порядке. Тогда систематического смешения с факторами задачи не происходит. Однако высокая степень изменчивости этих факторов снижает надежность эксперимента.
К систематическому смешению приводят также эффекты последовательности проб. При использовании схемы позиционного уравнивания внутренней валидности угрожает неоднородность влияний ранних и поздних экспериментальных проб. Труднее всего устранить такие случаи систематического смешения, когда влияния последовательности взаимно асимметричны, т. е. влияние условия А на условие Б отличается от влияния условия Б на условие А. И это может произойти в любом эксперименте, где различные условия независимой переменной предъявляются одному и тому же испытуемому.
1. Как еще можно оценить эксперимент, кроме оценки качества организации его хода и протоколирования?
2. Покажите, как с помощью понятия идеального эксперимента можно определить, что один способ проведения эксперимента лучше другого.
3. Почему для опытов Иоко с томатным соком образцом безупречного эксперимента служит бесконечный, а не идеальный эксперимент?
4. Как внутренняя валидность связана с безупречным экспериментом?
5. Можно ли считать хорошим эксперимент, который не вполне репрезентирует эксперимент полного соответствия?
6. Опишите основные факторы, затрудняющие достижение внутренней валидности эксперимента.
7. Почему вопрос о различии задач касался прежде всего эксперимента Джека с заучиванием фортепьянных пьес, а не двух других экспериментов?
8. Покажите различие между ненадежностью и систематическим смешением.
9. Как вы определите, что в эксперименте лучше применить схему регулярного чередования, чем схему случайной последовательности?
10. Сравните возможность систематического смешения при использовании схемы позиционного уравнивания и двух других схем.
11. В чем различие между систематическим смешением, которое может меняться от эксперимента к эксперименту при исследовании какой-то проблемы, и систематическим смешением, которое может произойти во всех экспериментах, направленных на решение данной проблемы?
В эксперименте по определению времени
реакции, описанном в приложении к главе
1, были взяты результаты
действительного эксперимента.
Предполагалось, что они представляют
такие данные, которые могли бы быть
получены в эксперименте с полной
внутренней валидностью. Так, среднее
время реакции на световой сигнал по 17
пробам представляло среднее, которое
можно было бы получить в эксперименте с
неограниченным числом проб.Мы
используем среднее для ограниченной
выборки проб, чтобы сделать вывод о
достаточно большой (вплоть до
неограниченной) популяции проб. Такая
популяция называется генеральной
совокупностью. Среднее по генеральной
совокупности таких, например, данных,
как ВР, обозначается Мх. Такую
характеристику генеральной
совокупности называют параметром.
Среднее, действительно вычисленное
нами для данной выборки, называется
статистикой, и обозначается Мх.
Является ли статистика Мх
наилучшей оценкой параметра Мх,
которую мы можем получить на основе
нашей выборки проб? Ответ — без
доказательства — да. Но прежде чем вы
решите, что это всегда так, давайте
перейдем, к стандартному отклонению,
где дело обстоит иначе.
Вычисление стандартного отклонения
Обычно помимо среднего значения оценок
мы хотим знать еще кое-что, а именно,
какова несистематическая вариация
оценок от пробы к пробе. Наиболее
распространенный способ измерения
несистематической вариации состоит в
вычислении стандартного отклонения.Для
этого, вы определяете, насколько каждая
оценка (т. е. X) больше или меньше
среднего (Мх). Затем вы
возводите в квадрат каждую разность (X-Мх)
и складываете их. Вслед за этим вы
делите эту сумму на N число проб.
Наконец, вы извлекаете квадратный
корень из этого среднего.Это
вычисление представлено формулой с
использование символа σх для
обозначения стандартного отклонения:
(2.1) Эту формулу можно сократить, введя
маленькое х для обозначения (X-Мх).
Тогда формула выглядит так:
(2.1A) Давайте выпишем данные по условию А
из приложения к главе I и одновременно
произведем по ним вычисления,
указываемые формулой для σх
Проба | X | Мх | X - МX | x2 |
илих | ||||
1 | 223 | 185 | +38 | +1444 |
2 | 184 | 185 | —1 | +1 |
3 | 209 | 185 | +24 | +576 |
4 | 183 | 185 | —2 | +4 |
5 | 180 | 185 | —5 | +25 |
6 | 168 | 185 | —17 | +289 |
7 | 215 | 185 | +30 | +900 |
8 | 172 | 185 | —13 | +169 |
9 | 200 | 185 | +15 | +225 |
10 | 191 | 185 | +6 | +36 |
11 | 197 | 185 | +12 | +144 |
12 | 188 | 185 | +3 | +9 |
13 | 174 | 185 | —11 | +121 |
14 | 176 | 185 | —9 | +81 |
15 | 155 | 185 | -30 | +900 |
16 | 165 | 185 | —20 | +400 |
17 | 163 | 185 | —22 | +484 |
Σx2 | +5808 |
Поскольку то
мс.
Оценка стандартного отклонения
генеральной совокупности. Для
определения среднего генеральной
совокупности, которое могло бы быть
получено в бесконечном эксперименте,
наилучшей оценкой фактически было
среднее по выборке. Иначе обстоит дело
со стандартным отклонением. В любом
наборе реальных проб имеет место
меньшее число результатов с очень
высокими или очень низкими значениями,
чем в генеральной совокупности. А
поскольку стандартное отклонение
является мерой разброса оценок, то его
величина, определенная на основе
выборки, всегда меньше параметра
генеральной совокупности сигма σх.Более
точная, оценка стандартного отклонения
для генеральной совокупности
находится по формуле
(2.2)или
(2.2А)Для наших числовых данных:
мс.В
некоторых экспериментах высказывается
гипотеза, что поведение в одном условии
более вариативно, чем в другом. Тогда
целесообразнее сравнивать стандартные
отклонения, а не средние. Если для обоих
условий N одно и то же, можно
сравнивать между собой сигмы. Однако
когда N различны, сигма для условия
с меньшим N дает более заниженную
оценку такого параметра генеральной
совокупности, как стандартное
отклонение. Поэтому следует сравнивать
два S. Таблица, которая
приводится ниже, поможет вам запомнить
эти положения и формулы.
Среднее |
Стандартное отклонение |
|||
Параметрические характеристики генеральной совокупности (г. с.) |
|
|
||
Статистические характеристики выборки |
|
|
||
Оцениваемый параметр генеральной совокупности |
|
|
или |
|
Статистическая таблица 1
Числа от 1 до 100 с их квадратами и корнями квадратными | |||||||||||
Число |
Квадрат |
Корень квадр. |
Число |
Квадрат |
Корень квадр. |
Число |
Квадрат |
Корень квадр. |
Число |
Квадрат |
Корень квадр. |
1 |
1 |
1.000 |
26 |
6 76 |
5,099 |
51 |
26 01 |
7,141 |
76 |
57 76 |
8,718 |
2 |
4 |
1,414 |
27 |
7 29 |
5,196 |
52 |
27 04 |
7,211 |
77 |
59 29 |
8,775 |
3 |
9 |
1,732 |
28 |
7 84 |
5,292 |
53 |
28 09 |
7,280 |
78 |
60 84 |
8,832 |
4 |
16 |
2,000 |
29 |
8 41 |
5,385 |
54 |
29 16 |
7,348 |
79 |
62 41 |
8,888 |
5 |
25 |
2,236 |
30 |
9 00 |
5,477 |
55 |
30 25 |
7,416 |
80 |
64 00 |
8,944 |
6 |
36 |
2,449 |
31 |
9 61 |
5,568 |
56 |
31 36 |
7,483 |
81 |
65 61 |
9,000 |
7 |
49 |
2,646 |
32 |
10 24 |
5.657 |
57 |
32 49 |
7,550 |
82 |
67 24 |
9,055 |
8 |
64 |
2,828 |
33 |
10 89 |
5,745 |
58 |
33 64 |
7,616 |
83 |
68 89 |
9,110 |
9 |
81 |
3,000 |
34 |
11 56 |
5,831 |
59 |
34 81 |
7,681 |
84 |
70 56 |
9,165 |
10 |
1 00 |
3,162 |
35 |
12 25 |
5,916 |
60 |
36 00 |
7,746 |
85 |
72 25 |
9,220 |
11 |
1 21 |
3,317 |
36 |
12 96 |
6,000 |
61 |
37 21 |
7,810 |
86 |
73 96 |
9,274 |
12 |
1 44 |
3,464 |
37 |
13 69 |
6,083 |
62 |
38 44 |
7,874 |
87 |
75 69 |
9,327 |
13 |
1 69 |
3,606 |
38 |
14 44 |
6,164 |
63 |
39 69 |
77,93 |
88 |
77 44 |
9,381 |
14 |
1 96 |
3,742 |
39 |
15 21 |
6,245 |
64 |
40 96 |
8,000 |
89 |
79 21 |
9,434 |
15 |
2 25 |
3,873 |
40 |
16 00 |
6,325 |
65 |
42 25 |
8,062 |
90 |
81 00 |
9,487 |
16 |
2 56 |
4,000 |
41 |
16 81 |
6,403 |
66 |
43 56 |
8,124 |
91 |
82 81 |
9,539 |
17 |
2 89 |
4,123 |
42 |
17 64 |
6,481 |
67 |
44 89 |
8,185 |
92 |
84 64 |
9,592 |
18 |
3 24 |
4,243 |
43 |
18 49 |
6,557 |
68 |
46 24 |
8,246 |
93 |
86 49 |
9,644 |
19 |
3 61 |
4,359 |
44 |
19 36 |
6,633 |
69 |
47 61 |
8,307 |
94 |
88 36 |
9,695 |
20 |
4 00 |
4,472 |
45 |
20 25 |
6,708 |
70 |
49 00 |
8,367 |
95 |
90 25 |
9,747 |
21 |
4 41 |
4,583 |
46 |
21 16 |
6,782 |
71 |
50 41 |
8,426 |
96 |
92 16 |
9,798 |
22 |
4 84 |
4,690 |
47 |
22 09 |
6,856 |
72 |
51 84 |
8,485 |
97 |
94 09 |
9,849 |
23 |
5 29 |
4,796 |
48 |
23 04 |
6,928 |
73 |
53 29 |
8,544 |
98 |
96 04 |
9,899 |
24 |
5 76 |
4,899 |
49 |
24 01 |
7,000 |
74 |
54 76 |
8,602 |
99 |
98 01 |
9,950. |
25 |
6 25 |
5,000 |
50 |
25 00 |
7,071 |
75 |
56 25 |
8,660 |
100 |
1 00 00 |
10,000.. |
[1] В оригинале – каламбур, основанный на многозначности слова "nut", в частности "техническая деталь" и "незадачливый человек, чудак" (прим. перев.).