Проблемы, связанные с построением шкал балльных оценок

Постоянные ошибки и их контроль. Использование балльных оценок основывается на предположении, что человек-наблюдатель является хорошим инструментом количественного наблюдения, что он способен делать точ­ные и объективные суждения. Тем не менее, хотя мы и предполагаем возможность вынесения количественных суждений, мы должны всегда быть бдительными к влия­нию предпочтений (байесов) в этих суждениях. След­ствием этого влияния могут быть систематические ошиб­ки в суждениях испытуемых. Рассмотрим некоторые наи­более распространенные байесы в процедурах метода балльных оценок.

Ошибки "смягчения" суждений. Многие испытуемые имеют тенденцию оценивать то, что они хорошо знают или то, что чаще встречается, выше, чем следует. Это — систематическая ошибка, которая не зависит от шкалируемого признака. Некоторые самокритичные испытуе­мые, которые отдают себе отчет в этой слабости, могут, в результате, удариться в другую крайность и давать оценки ниже, чем следует. Для описания таких отклонений и ис­пользуется термин "ошибка смягчения", применимый к общей постоянной тенденции испытуемого оценивать объекты шкалирования слишком высоко или слишком низко. При занижении оценки постоянная ошибка на­зывается ошибкой негативного смягчения. Так как поло­жительная ошибка смягчения является намного более об­щей, некоторые исследователи пытались предвосхитить ее и изменить шкалу так, чтобы нейтрализовать ошибку. Примером такой модификации шкалы успеваемости, рассмотренной выше, может служить следующая шкала:

Плохая Средняя Хорошая Очень хорошая Блестящая

На этой шкале большинство признаков имеет благо­приятное значение.

Можно предвидеть, что средняя балльная оценка рас­положится где-то рядом с признаком "хорошее" и рас­пределение будет симметрично относительно этой точки.

Ошибка центрации. Одной из причин ошибки центрации, или, как ее называют, центральной тенденции, является та, что испытуемый реже дает крайние утверж­дения и, таким образом, смещает оцениваемые объек­ты-стимулы в направлении к середине всей группы. Это особенно характерно для балльных оценок таких объек­тов, о которых эксперты-испытуемые знают не очень много. По этой причине в связи с графическими шкалами давалась рекомендация располагать описательные фразы в середине шкалы с большими промежутками, чем на краях. Подобным же образом в числовой шкале интен­сивность описательных прилагательных может быть уста­новлена так, чтобы значения у концов шкалы больше различались между собой, чем значения у центра при одном и том же расстоянии между ними на линии. Это окажет противодействие ошибке центрации.

Влияние контекста. Ошибка центрации является част­ным случаем более общего типа ошибок, связанных с вли­янием контекста на суждения испытуемого. Согласно тра­диционному подходу при шкалировании сенсорных и пер­цептивных объектов главный интерес исследователей сосредотачивался на получении оценок каждого стимула, величина которых, как предполагалось, определяется только наличным сенсорным впечатлением и не зависит от стимульного контекста. Первая брешь в этом подходе была пробита Хелсоном, разработавшим теорию уровня адапта­ции (УА). Согласно Хелсону (1975), оценку любой характе­ристики стимула (например, вес, яркость, размер) чело­век соотносит со своей субъективной шкалой, точнее го­воря, с нейтральной точкой на этой субъективной шкале или точкой отсчета, названной Хелсоном уровнем адапта­ции. Значения стимулов, превышающие величину стиму­ла, соответствующего уровню адаптации, оцениваются как более "тяжелые", "яркие", "большие", а не достигающие этой величины — как более "легкие", "тусклые", "малень­кие". Хелсон считает, что уровень адаптации является сум­марным результатом трех классов воздействия: 1) ряда сти­мулов, оцениваемь1х в данном эксперименте; 2) всех дру­гих стимулов, воздействовавших на человека во время измерения и составляющих контекст для первого класса стимулов и 3) стимулов, действовавших в прошлом на этого человека и оставивших след в его памяти. Уровень адапта­ции вычисляется как среднее геометрическое всех воздей­ствовавших стимулов. В случае получения категориальной шкалы, когда испытуемый использует заданное число ка­тегорий для суждения о стимуле, грубая оценка уровня адаптации может быть получена путем вычисления средне­го арифметического в средней или нейтральной категории (например, если используется 9 категорий в суждении о стимулах, то стимул, соответствующий среднему среди попавших в пятую категорию, характеризует уровень адап­тации). Более точная оценка уровня адаптации получается на основе использования всех полученных в эксперименте данных и состоит в нахождении с помощью метода наи­меньших квадратов наилучшей аппроксимации получен­ной психофизической зависимости и определении по ней стимула, соответствующего нейтральной точке шкалы суж­дений.



Экспериментальное исследование влияния различных контекстов на простые перцептивные суждения проводи­лось Пардуччи и Маршилл (1961). Эти исследователи предъяв­ляли испытуемым наборы линий с различным распределе­нием их длин и просили их высказывать суждение о длине, приписывая каждой линии одну из шести категорий — от 1 (очень короткая) до 6 (очень длинная). Наборы линий различались по значению либо среднего арифметического длин линий, либо медианы, либо средней точки — сред­ней между самой длинной и самой короткой линиями в ряду. Было обнаружено, что на центрирование шкалы суж­дений, отражавшихся в величине уровня адаптации, за­метно влияет только изменение медианы в наборе линий. Изменение среднего арифметического ряда линий не ока­зывает существенного влияния на уровень адаптации.

В других работах Пардуччи (1974) было установлен­ие, что форма психофизической функции, получен­ной при использовании категориальных суждений, зависит от характера распределения стимулов в исполь­зуемом диапазоне стимуляции. Им было показано, что форма функции является более крутой для части стимульной области, где стимулы расположены более плот­но в пространстве или предъявляются с большей час­тотой. Эти данные хорошо согласуются с гипотезой Пардуччи о том, что шкала суждений представляет со­бой компромисс между двумя различными тенденция­ми: 1) выносить суждение о длине линий, опираясь на перцептивное впечатление от стимула; 2) использо­вать различные категории суждений с равной частотой.

"Гало-эффект". Постоянную ошибку, связанную с влиянием всей личности оцениваемого индивида на оцен­ку отдельной черты характера (Узле, 1907), называют "гало-эффектом". "Мы судим о наших близких с точки зрения общей умственной установки на них и эта умственная установка по отношению к личности, как к целому, преобладает над установкой в отношении от­дельных черт характера", — говорил Торндайк (1920). результатом "гало-эффекта" будет усиление балльной оценки любой характеристики, совпадающей с общим впечатлением от оцениваемых индивидов. Это делает бал­льные оценки некоторых характеристик менее валидны­ми. Другим результатом этого байеса будет неверное ко­личество положительных корреляций между оценивае­мыми характеристиками. Из-за этого балльные оценки, в которых нет "гало-эффекта", некоторым образом сво­дятся на нет. "Гало-эффект" похож на ошибку стимула в психофизике. Он включает иррелевантный критерий, которым зашумляются суждения. Конечно, избежать пол­ностью гало-ошибки невозможно, но опыт показывает, что вероятнее всего она обнаруживается в следующих случаях (Саймондз, 1925):

1. В признаках (характеристиках), которые трудно по­яснить.

2. В экзотических, нетрадиционных признаках.

3. В недостаточно четко определенных характеристи­ках.

4. В признаках, включающих связи с другими людьми.

5. В характеристике, имеющей высокую моральную цен­ность. Это относится и к так называемым чертам характера.

Наилучший способ избежать "гало-эффекта" дости­гается при использовании метода графического шкали­рования, где в каждом случае оценивается только одна характеристика.

Логическая ошибка в балльной оценке. Ошибка, выз­ванная тем, что эксперты или испытуемые дают одина­ковые балльные оценки для тех характеристик, которые кажутся логически соотнесенными друг с другом, назы­вается логической ошибкой (Ньюкомб, 1931). Так же, как и гало-эффект, эта ошибка искажает взаимосвязи характеристик, увеличивая эти связи, но по другой при­чине. В "гало-эффекте" это является следствием очевид­ной для испытуемого связанности отдельных личност­ных качеств, тогда как в логической ошибке это является следствием логической согласованности различных харак­теристик, независимо от индивидов. Логической ошиб­ки можно избежать, обращая внимание испытуемого на объективно наблюдаемые связи, а не на абстрактные логические или семантические совпадения характерис­тик.

Ошибки контраста. Под любой ошибкой контраста подразумевается тенденция испытуемого переоценивать других людей в противоположном направлении по срав­нению с самим собой. Например, испытуемые, которые сами очень аккуратны, имеют тенденцию оценивать дру­гих как менее аккуратных, чем они есть на самом деле. Ошибки контраста связаны с наличием различного рода личностных ( и не только личностных) установок. Фено­мен психологической проекции, выявленный психоана­лизом, также участвует в формировании этих установок.

Измайлов Ч.А. ИЗМЕРЕНИЯ В ПСИХОЛОГИИ[29]

ИЗМЕРЕНИЯ В ПСИХОЛОГИИ(англ. measurements in psychology) — процедуры получе­ния числовых характеристик для величин свойств изучаемых в психологии явлений и объектов, напр., моторных и речевых реакций, ощущений, способ­ностей, мотивов, установок и поступков личности, ее статуса в группе. В послесловии к книге американского психолога Джеймса Кеттела (Cattell J. Mental Test and Measurements, 1890) основатель биометрии Ф. Гальтон (1822-1911) уверенно предрек: «Пси­хология не может стать прочной и точной, как фи­зические науки, если не будет основываться на эк­сперименте и измерении». Сам Гальтон со страст­ной одержимостью внедрял измерения и в др. науки, буквально следуя афоризму Г. Галилея: «Из­меряй все, поддающееся измерению, и сделай та­ким все, не поддающееся измерению».

Разнообразные виды измерения в теоретиче­ском плане формализуются с помощью понятий числового представления и шкалы. Числовое пред­ставление— это функция, гомоморфно отобража­ющая эмпирическую систему с отношениями в числовую систему с отношениями. Шкала— это множество чисел, отношения между которыми от­ражают отношения между объектами эмпириче­ской системы. В частности, шкалой можно назвать результаты измерения, полученные определенной системой вопросов, заданных испытуемому, а так­же сам инструмент измерения (т. е. систему во­просов, опросник, тест). Шкалы разделяют по типу в соответствии с тем, какие отношения они отра­жают, и, что эквивалентно, теми допустимыми (математическими) преобразованиями, которые оставляют инвариантными соответствующие отно­шения. Широко известна простая типология шкал, предложенная американским психологом-психофизиком Стэнли Стивенсом (1946): шкала отношений, ин­тервальная, порядковая и номинальная шкалы.

Номинальная шкала(или шкала наименова­ний) отображает лишь отношение эквивалентно­сти, посредством которого объекты группируются в отдельные непересекающиеся классы, причем номер класса фактически не имеет количественно­го содержания и м. б. заменен названием, шифром и т. д. Примером шкалы такого рода может служить нумерация игроков спортивных команд.

Порядковая(или ранговая) шкалаотобража­ет, кроме отношения эквивалентности, еще и отно­шение порядка; допустимым для нее будет любое монотонное преобразование. Примеры: балльные оценки успеваемости в школе, шкала твердости минералов (шкала Мосса).

Интервальная шкала,помимо отношений, указанных для шкал наименований и порядка, ото­бражает отношение расстояний (разностей) меж­ду парами объектов. Для нее допустимым являет­ся положительное линейное преобразование (изо­метрическое преобразование). Шкалы Цельсия и Фаренгейта, с помощью которых измеряется фи­зическая температура, представляют примеры ин­тервальных шкал. В психологии к таким шкалам относят шкалы измерения различных субъектив­ных феноменов, полученные методом парных срав­нений. См. также Аддитивная шкала.

Шкала отношений(пропорциональная шка­ла) допускает лишь умножение шкальных значе­ний на константу (преобразование подобия). В фи­зике этому типу шкалы удовлетворяют многие про­цедуры измерения, напр., массы в кг, длины в м, температуры в град. Кельвина. Иногда в качестве синонима «шкалы отношений» используется тер­мин «абсолютная шкала», поскольку нулевая точ­ка здесь не является произвольной и называется «абсолютным нулем». Однако термин «абсолют­ная шкала» имеет и более узкое значение, когда он применяется для обозначения шкалы, допускаю­щей лишь тождественные преобразования и ото­бражающей количество «неделимых» и «однород­ных» (дискретных) объектов, напр., количество жителей города N, число зубов, объем кратковре­менной памяти и т. д.

С вопросом о типе шкалы непосредственно связана проблема адекватности (корректности) методов математической обработки результатов измерения. В общем случае, адекватными являют­ся те статистики, которые инвариантны относи­тельно допустимых преобразований используемой шкалы измерения.

Экспериментальная психология родилась не просто благодаря лабораторному эксперименту, а эксперименту, включающему измерения различ­ных величин (интенсивности ощущений, времени реакций, объема памяти, умственного возраста и т. д.). На первых порах психологи стремились к созданию процедур и шкал измерения, сопостави­мых по типу с общепринятыми в естественных на­уках пропорциональными измерениями: именно такой подход исповедовал основатель классиче­ской психофизики Г. Т. Фехнер). Однако реальное расширение методов психологического измерения происходило в большей степени отнюдь не за счет методов высшей пробы, и это давало повод для бес­покойства. Некоторое облегчение принесла не­традиционная трактовка измерения «как припи­сывания чисел объектам или событиям согласно правилам» (С. Стивенс). В действительности ока­залось, что в психологии несравнимо легче найти методы приписывания чисел, чем определить ре­альные правила этой деятельности. Измеритель­ные процедуры для психических явлений не лучше известны, чем то, что ими измеряется. Как откро­венно заметил У. Торгерсон (1958), большинство измерений в бихевиоральных науках основаны на соглашениях и интуициях экспериментаторов. Из признания этого факта не следует необходимость отказа от существующих методов измерения и ме­тодов обработки исходных данных, поскольку их ценность определяется не столько предполагаемой точностью и уровнем измерения (типом шкалы), сколько способностью предсказывать наблюдае­мые факты, в т. ч. и сугубо практические. Тем не менее это признание необходимо для того, чтобы не допускать наивных ошибок.

Дефиниция Стивенса дала мощный толчок для развития в психологии, наряду с процедурами объективного измерения (г. о. внешних реакций) с помощью физических приборов, процедур субъективного измере­ния,когда изучаемый человек сам же и выполняет функцию измерительного прибора. Конечно, ис­следователь с помощью инструкции и специаль­ных средств должен организовать деятельность «субъективного прибора». Такой подход реализу­ется, например: в методах категориальной оценки,где испытуемому предъявляются одиночные стимулы и ряд оценочных категорий (напр., сильный—сред­ний—слабый; абсолютно верно—сомнительно—аб­солютно неверно и т. п.) и требуется подыскать каждому стимулу соответствующую категорию; в методах числовой (или балльной) оценки,где сти­мулы предъявляются обычно одиночно, каждому из них испытуемый приписывает то или иное чис­ло (ранг, балл) в соответствии со степенью выра­женности заданного свойства у стимула (числовая шкала м. б. в разной степени ограниченной); в ме­тодах ранжирования,где предъявляется весь на­бор стимулов и испытуемый производит их упо­рядочение по степени выраженности некоторого свойства, причем ему поясняют, что сначала выби­рается стимул с максимально (минимально) выра­женным заданным свойством, затем из оставших­ся стимулов следует тоже выбрать стимул с мак­симально (минимально) выраженным заданным свойством и т. д.; в методах с парными сравнения­ми,где испытуемому последовательно предъявля­ются пары стимулов (это могут быть слова, суждения, картинки, физические объекты) и требуется в каж­дой паре выбрать тот стимул, в котором более вы­ражен указанный экспериментатором признак.

В перечисленных методах, как правило, про­изводится одномерное измерение: полученные ре­зультаты упорядочиваются на одной-единственной шкале.

Однако в связи с развитием математи­ческого метода факторного анализа широкое распространение в психологии получили субъек­тивные методы многомерного измерения; к ним относятся, напр., метод семантического дифферен­циала (и его варианты), а также методы многомер­ного шкалирования,в которых испытуемые дают числовые оценки субъективным расстояниям меж­ду стимулами. Существующие компьютерные про­граммы позволяют без особого труда представить любые данные, полученные такими методами, в виде N-мерного пространства, природа и смысл которого нередко остаются загадочными даже для исследователя.

***

ШКАЛИРОВАНИЕ МНОГОМЕРНОЕ(англ. multidimensional scaling) — вид шкалирования, ко­торое в большинстве случаев основано на немет­рических методах оценки сходства и различия меж­ду сигналами. Шкалирование многомерное занимает особое место среди методов (пси­хофизического) шкалирования. Особенность шкалирования многомерного состоит в том, что с помощью единой процедуры измеряется сразу несколько параметров, по кото­рым различаются сигналы. При этом на исходные оценки накладываются достаточно слабые ограни­чения: достаточно, чтобы они представляли собой величины на шкале порядка. Например, испытуемые используют для оценки пар стимулов 10-балльную шкалу — от 0 (нет различия) до 9 (максимальное различие). После соответствующей обработки экспериментальных данных (матриц различия) определяется структура базисного субъективного пространства, которое, как правило, интерпрети­руют в терминах геометрического (чаще Евклидо­ва) пространства. При этом каждый стимул пред­ставлен точкой или вектором в пространстве ми­нимально возможной размерности так, чтобы сохранялась монотонность соответствия межто­чечных расстояний (различий параметров векто­ров) исходным оценкам. Одним из преимуществ шкалирования многомерного является то, что 2 неметрических по своему содержанию условия (монотонности и минималь­ной размерности) позволяют получить полную метрическую информацию из порядковых данных. Особую трудность в шкалировании многомерном представляет раз­работка теоретических основ построения много­мерных шкал, но, несмотря на это, шкалирование многомерное вполне оправдало себя в исследованиях цветового зрения, вкусового ощущения, восприятия запаха и т. д.

Р. Вудвортс, Г. Шлосберг. МЕТОДЫ ШКАЛИРОВАНИЯ [30]

  • ПСИХОЛОГИЯ ПАНИКИ. ление вернуться к матери
  • IV. Особенности детской и подростковой психологии
  • РОЗДІЛ V
  • Арх.-конструкт. элем. стен
  • IV. Рекомендуемые источники. Нормативно-правовые документы
  • Обладать 33 страница
  • НЕДОПЕТАЯ ПЕСНЯ
  • Сцена двенадцатая
  • Глава 9. Боль старости.
  • Канетти Э. Масса и власть 4 страница
  • Бихевиоризм
  • Соло на 2 стр. -356565656-653535353-31313131-57575757-57878787878-575757575-535353535-575757
  • Техническая результативность производства в краткосрочном периоде. Закон убывающей отдачи
  • Вторая волна - харизматическое движение
  • Статья 225. Бесхозяйные вещи
  • Это крутейший набор фишек
  • Комбинированные перевозки
  • Уголовное право по Уложению о наказаниях уголовных и исправительных
  • Иные части тела отсутствовали или были неправильно сформированы.
  • Резко повернувшись, Караффа вышел из комнаты...