К теме 1.3. (3) курса «Психодиагностика». Вопросы о психометрических критериях и о шкалах измерения в психологии.
Практикум по общей, экспериментальной и прикладной психологии / В.Д. Балдин, В.К. Гайда, В.К. Гербачевский и др. Под общей ред.А.А. Крылова, С.А. Маничева. – СПб.: Питер, 2003. – С.7–15.
I. Приемы измерений и статистические способы обработки их результатов в психологическом исследовании
…Приступая к выбору методики; экспериментатор должен иметь четкое представление о том, что именно он хочет измерить и удовлетворят ли результаты измерения требованиям адекватного решения исследовательской или практической задачи. В первую очередь ему надлежит доказать валидность, надежность и объективность избранной методики. Под валидностью методики понимается адекватность ее предмету исследования. Количественно валидность определяется путем установления взаимосвязи между результатами, полученными с помощью данной методики, и каким-либо из внешних критериев. Поясним сказанное примером. Очевидно, что успешность обучения в какой-то степени обусловлена уровнем интеллектуального развития обучаемого, и поэтому в качестве внешнего критерия правомерно рассматривать оценку его успеваемости. Допустим, что было проведено тестовое исследование умственного развития группы лиц, например студентов, с помощью избранной методики. Так вот, применяемая методика может считаться валидной лишь в том случае, если между результатами тестирования и оценкой успеваемости в обучении будет обнаружена положительная взаимосвязь. Не менее важным аспектом оценки качества методики является ее надежность. Под надежностью психологической методики понимается точность производимых с ее помощью измерений. Иначе говоря, через надежность определяется пригодность данной методики в качестве измерительного инструмента. Наконец, объективность методики характеризует степень независимости результатов измерения от пользователя данной методики. Объективными результаты будут лишь в том случае, если, во-первых, они независимы от личностных особенностей пользователя и, во-вторых, исключен произвол в их обработке и интерпретации.
Для проверки валидности и надежности методик чаще всего привлекаются количественные (статистические) критерии оценки. Объективность методики можно обосновать исходя из положений общей теории измерений и специфики их в отношении психологического исследования. Конечно, это вовсе не означает, что психологическое исследование исчерпывается измерением. Однако знание разнообразных измерительных процедур вооружает психолога исследовательским инструментом, с помощью которого он способен решать психологические задачи.
ТИПЫ ИЗМЕРИТЕЛЬНЫХ ШКАЛ
С точки зрения теории измерения, все множество различных измерительных процедур, применяемых в психологии, является процедурами построения шкалы психологической переменной, иначе говоря, процедурами психологического шкалирования. В понимании большинства психологов шкалирование — это совокупность экспериментальных и математических приемов для измерения особенностей психических процессов и состояний.
Вслед за С. С. Стивенсом в настоящее время понятие «шкалирование» рассматривают в качестве синонима понятия «измерение». Под шкалированием психологических процессов, свойств, объектов или событий понимается процесс приравнивания к этим процессам, свойствам, объектам или событиям чисел по определенным правилам, а именно таким образом, чтобы в отношениях чисел отображались отношения явлений, подлежащих измерению. Если постулируется, что в свойствах чисел отображаются количественные значения объектов реального предметного мира, то общую проблематику шкалирования правомерно рассматривать как частный случай проблемы отражения марксистско-ленинской теории познания.
Итак, измерение состоит в отображении эмпирических систем с помощью математических систем, а целью такого рода отображения является частичная замена действий, производимых с реальными предметами, формальными действиями с числами. Область чисел выполняет функцию модели определенных свойств предметов и в качестве средства познания дает возможность более глубоко проникать в объективно существующие свойства и взаимосвязи. В этом смысле шкалирование (измерение) служит главной силой, преобразующей психологию из науки описательной, следующей за фактами, в науку, умеющую предсказывать новые факты.
Понятно, что относительно разных эмпирических систем мы должны использовать разные методики измерения, т. е. применять измерительные шкалы разных типов. Понимание исследователем формальных аспектов измерения является необходимым условием для адекватного выбора им измерительных инструментов и процедур, а также для применения адекватных методов анализа полученных в наблюдении и эксперименте данных. Основываясь на правилах измерения, принято различать несколько типов шкал, с каждым из которых могут быть соотнесены конкретные процедуры шкалирования. При этом каждый тип шкалы может быть охарактеризован соответствующими числовыми свойствами. Рассмотрим более подробно основные свойства разных типов шкал, эмпирические операции, допустимые на уровне этих шкал, а также статистические приемы обработки и анализа исходных или, как их чаще называют, первичных результатов исследования.
Шкалы наименований,или номинативные шкалы.Шкала наименований представляет собой взаимнооднозначное отображение некоторой эмпирической системы в числовой системе. Таким образом, шкала наименований отображает взаимнооднозначное соответствие между классами эквивалентности, т. е. классами эмпирических объектов — обозначений. Само название «шкала наименований» указывает на то, что в этом случае шкальные значения играют роль лишь названий классов эквивалентности.
Шкалы наименований подчиняются законам равенства. То есть объект А может быть равен объекту В по признаку X, так что ХА=ХВ; но по отношению к третьему объекту С по признаку X он может быть неравным: ХА≠ХС. Любая другая связь между шкальными значениями, за исключением равенства, не имеет отношения к данному случаю, так как для данного типа шкал не существует никакого дополнительного определения.
Шкала наименований представляет собой наиболее общую форму шкал. Всё типы шкал в каждом отдельном случае являются некоторыми видами шкал наименований, но обладающими при этом теми или иными дополнительными свойствами. При построении шкал наименований должны быть выполнены следующие требования: во-первых, каждый член некоторого множества объектов должен быть отнесен лишь к одному классу объектов («ли к собирательному классу «прочие объекты») и, во-вторых, ни один из объектов не может быть отнесен одновременно к двум или большему числу классов. К примеру, если принять, что глаза у людей могут быть только светлыми или темными, то все люди по этому признаку разделяются на две группы. При этом люди с множеством оттенков глаз: голубых, серо-зеленых и серых попадут в класс «люди со светлыми глазами», а те, у которых глаза карие и темно-коричневые, — в класс «люди с темными глазами». Из приведенного примера видно, что отношения эквивалентности по заданному признаку между классифицируемыми объектами, как правило, грубее реальных отношений, существующих между объектами.
С формальной точки зрения установление классов эквивалентности как будто не вызывает никаких затруднений. В действительности, как это было показано предыдущим примером, понятие «равенство» можно трактовать более узко или более широко в зависимости от «тонкости» или «грубости» используемой классификации по заданному признаку. Проиллюстрируем это обстоятельство еще одним примером. Так, если делается попытка упорядочить события по признаку «мороз/оттепель», то температуры, обозначаемые как+1° и - 1°, будут входить в два разных неэквивалентных класса, в то время как температуры +1 и +10° попадут в один класс и по признаку «мороз/оттепель» будут рассматриваться как эквивалентные события.
Приведенные примеры должны были показать, что при построении шкал наименований главными являются качественные различия, а количественные не принимаются во внимание. Поэтому числа, используемые в качестве обозначений классов эквивалентности в этих шкалах, не отражают количественных различий выраженности изучаемого признака.
В примере с температурой мы имели дело с дихотомической (делением на два класса), или альтернативной, классификацией. Эти классификации можно образовать по логическому принципу «А/не-А», т. е. согласно принципу наличия или отсутствия определенного признака. Примерами такого рода классификации могут быть: «нормальный/анормальный», «женатый/ холостой», «решает задачу/не решает задачу» и т. п. В случае так называемой истинной дихотомии классы могут быть четко разделены по определенному признаку, например: «мужской/ женский пол».
Однако бывают классификации с менее жесткими переходами признака, т. е. с довольно произвольными границами между классами эквивалентности, например: «способен к концентрации внимания/не способен к концентрации внимания». Именно с такого рода классификациями чаще всего и имеет дело психолог. Это так называемые квазидихотомические классификации. Построение и использование шкал с квазидихотомическими границами классов вызывает ряд затруднений. Первая трудность, которая при этом возникает, состоит в установлении границы классов. В частности, каков же будет в нашем примере критерий «способности» к концентрации внимания, как определить точку в континууме «концентрация внимания», дифференцирующую людей на «способных» и «неспособных» к концентрации внимания?
Разберем другой пример из области психологии мышления. На первый взгляд альтернатива «решил задачу/не решил задачу» вполне может быть расценена как истинно-дихотомическая классификация. И действительно, в принципе для отнесения любого конкретного решения к классу «решил задачу» достаточно соотнести получаемый в нем результат с результатом, полученным достаточно большой группой людей, аналогичным образом решивших данную задачу. Все остальные решения можно тогда отнести к классу «не решил задачу». Однако возникает вопрос: действительно ли данный человек решил эту задачу? И вот почему: вполне возможно, во-первых, что решение было случайным, т. е, случайно данный результат совпал с результатом решения других людей и, во-вторых, что этот класс задач заранее был известен данному человеку. Но, как правило, такого рода сопровождающие факторы, например в психодиагностических тестах, совершенно не учитываются.
В шкале наименований с числами, которые мы приписываем объектам или классам объектов, нельзя производить никаких арифметических действий. Числа, обозначающие классы, нельзя суммировать, вычитать, умножать и делить. Дело в том, что структура шкалы остается инвариантной по отношению к перемене обозначений (наименований) и к изменению последовательности, т. е. разного рода перестановкам. Следовательно, операция присвоения чисел классам объектов является совершенно произвольной операцией и ей не соответствуют операции, производимые с реальными объектами. Поэтому классы объектов можно обозначать любыми символами — произвольными числами, буквами или другими знаками при одном условии: каждый символ будет использован исключительно для обозначения одного класса объектов и одновременно ни один класс объектов не будет обозначаться двумя или большим числом символов.
Из вышесказанного уже очевидны те ограничения, которые накладываются на использование статистических приемов обработки результатов, полученных на уровне шкалы наименований. Поскольку операции арифметического характера не допускаются, то в качестве меры центральной тенденции можно использовать лишь моду. Модальный класс объектов определяют после подсчета абсолютных или относительных частот, т. е. встречаемости того или иного результата в каждом классе. В качестве меры тесноты взаимосвязи между различными массивами измерений можно использовать некоторые коэффициенты корреляции. Для оценки статистической значимости различий между частотами или между модами можно использовать критерий хи-квадрат.
Шкалы порядка,или ординальные шкалы.В порядковых измерениях символы, в частности числа, присваивают классам объектов так, чтобы первые отображали не только равенство или неравенство, эквивалентность или неэквивалентность, но и упорядоченность объектов в отношении измеряемого свойства. В шкалах порядка классы объектов, как и в случае шкал наименований, являются дискретными. И хотя числа можно сравнивать, всегда надо помнить, что в шкалах порядка их величины имеют лишь относительное, а не абсолютное значение. Например, если какой-то один класс объектов обозначен большим числом, чем другой, то мы понимаем, что по измеряемой характеристике первый превосходит второй, но при этом нам неизвестно, насколько велико это различие. Дело в том, что в самих измерительных операциях, связанных с установлением порядка, не содержится никаких данных о величине различий. Рассмотрим в качестве примера оценки знаний материала студентами во время экзаменов. Различия между оценками 5 — «отлично» и 4 — «хорошо» указывают лишь на то, что уровень знаний отличника выше уровня знаний «хорошиста». Однако на основе такого рода оценок нельзя сказать, насколько или во сколько раз эти уровни знаний отличаются друг от друга.
Таким образом, шкала порядка отображает монотонное возрастание или убывание измеряемого признака с помощью монотонно возрастающих или монотонно уменьшающихся чисел. Оценить направление изменения признака можно только в том случае, если шкала порядка содержит не меньше трех классов, которые образуют последовательность. Из-за того, что в шкале порядка устанавливается последовательность классов, любые преобразования, связанные с перестановками элементов этой шкалы, недопустимы.
К числу постулатов, которым подчиняются преобразования шкал порядка, Относятся постулаты трихотомии, асимметрии и транзитивности. Прежде всего рассмотрим явление трихотомии. Если два объекта А и В обладают признаком X, то между ними по данному признаку может существовать одно из трех отношений: ХА<ХВ, или ХА=ХВ, или ХА>ХВ. В соответствии с постулатом асимметрии справедливым будет следующее утверждение: если между объектами А и В по признаку X обнаружено неравенство ХА>ХВ, то никогда не может быть ХА<ХВили ХА=ХВ. Наконец, в соответствии с постулатом транзитивности можно утверждать, что если три объекта А, В и С обладают признаком X и между ними по признаку X существуют отношения ХА<ХВи ХВ<ХС, то из этого следует, что ХА<ХС. Следовательно, для порядковых шкал допустимы любые преобразования типа х'=f(х)', где f(х) представляет собой любое монотонное преобразование, не изменяющее последовательности элементов. Это означает, что для преобразования шкал порядка можно пользоваться возведением в степень, извлечением корня, логарифмированием.
Довольно часто при сборе информации, служащей основой конструирования шкал порядка, нарушается постулат о транзитивности. Представим себе, что во время состязаний спортсменов или при решении испытуемым задач диагностического теста результаты лица А лучше результатов лица В, но у последнего они лучше, чем у лица. С. Очевидно, что в этом случае никакой проблемы в упорядочении результатов не возникает и можно построить последовательность А>В>С. Однако во время спортивных состязаний во время тестирования бывает так, что результат С оказывается лучшим, чем результат А. Очевидно, что в таком случае постулат о транзитивности исходных величин нарушен. Поэтому для построения порядковых шкал приходится привлекать дополнительные критерии. Например: спортсменам предлагают провести не одну, а несколько игр, и испытуемым решить не одну, а множество задач одной трудности. Тогда ранговое место игрока, т. е. место испытуемого среди других лиц опытной группы, определится уже по иному критерию, а именно по частоте выигрышей или числу правильно решенных задач.
Упорядочивание объектов может быть униполярным или биполярным. При униполярном установлении порядка объекты или классы объектов соотносят, используя в качестве индикатора степень выраженности одного-единственного свойства. Например, шкала порядка для оценки умственной отсталости может содержать следующие классы: «нет отклонения от нормы/отклонение слабое/отклонение среднее/отклонение сильное».
При биполярном упорядочивании исходят, как правило, из полярных проявлений какого-то свойства, которые фиксируются в виде двух «точек отсчета» на шкале. Примером биполярной шкалы в психологическом исследовании является методика семантического дифференциала. В этом случае для построения шкалы первоначально производят отбор некоторого множества понятий, которые могут характеризовать, по мнению исследователя, изучаемые психические свойства испытуемого. Затем каждому понятию находят антоним (например: «общительный — замкнутый», «сильный — слабый», «уравновешенный — неуравновешенный»). Очевидно, что между каждыми двумя такими понятиями располагается несколько промежуточных оценочных категорий. Словесное определение промежуточных категорий очень часто вызывает у исследователей значительные трудности, поскольку в языке, как правило, мы легче находим понятия для обозначения экстремальных степеней выраженности какого-то свойства и труднее — для промежуточных.
Примерами использования в психологии порядковых шкал могут служить первичные результаты тестовых испытаний группы лиц, первичные результаты при использовании некоторых личностных опросников, работы со шкалами самооценки и т. п. Можно сказать, что результаты большинства психологических исследований представляют собой ординальные величины, т. е. выражающиеся порядковыми числами. Об этом необходимо помнить, поскольку характер первичных результатов накладывает ряд ограничений на возможность использования тех или других статистических приемов их обработки и анализа. Поскольку в порядковых шкалах не определена единая точка отсчета величин, то и для их элементов, как и для элементов шкал наименований, непригодны способы расчета, требующие арифметических действий, — в частности сложение и вычитание. В качестве меры положения классов объектов для преобразования шкал порядка кроме моды (Мо) могут быть использованы еще и медиана (Ме), полуквартильные отклонения (Q1 и Q3), а в качестве меры тесноты взаимосвязи классов — коэффициент ранговой корреляции Ч. Спирмена (ρ).
Шкалы интервалов.Когда шкала обладает всеми свойствами порядковой шкалы и дополнительно к этому определены еще расстояния между ее единицами, то такую шкалу называют шкалой интервалов. Иначе говоря, классы объектов шкал интервалов всегда дискретны и упорядочены по степени возрастания (или убывания) измеряемого свойства. Кроме того, в этих шкалах одинаковым разностям степени выраженности измеряемого свойства соответствуют равные разности между приписываемыми им числами. Шкалы интервалов имеют равные единицы измерения, однако способ их определения является произвольным, следовательно, и сами единицы произвольны. При этом неизвестна абсолютная величина отдельных значений по шкале, поскольку шкала интервалов не имеет естественной нулевой точки отсчета. Последняя может быть произвольно смещена.
Шкалам интервалов присущи все те отношения, которые характерны для номинативных и порядковых шкал. Кроме того, для них возможно использование арифметических действий. Основными операциями с элементами интервальных шкал являются операции установления равенства, разности, сопоставление больше—меньше в отношении измеряемых свойств, а также утверждение равенства интервалов и равенства разностей между значениями одной шкалы. Наряду со всеми ранее указанными свойствами номинативных и порядковых шкал шкалы интервалов подчиняются еще и следующим постулатам сложения:
а+b=b+а и (а+b)+с=а+(b+с,)
если а=р и b>0, то а+b>р,
если а=р и b=q, то а+b=р+q.
С интервальными шкалами допускаются, следовательно, любые линейные преобразования типа х'=ах+b для а>0, при которых сохраняется не только последовательность градаций измеряемого свойства объектов, но и величина относительных расстояний между классами объектов. Возможность смещения точки отсчета отражена в константе b, а величина единиц ,шкалы связана с константой а.
Хотя психологические измерения дают нам преимущественно ординальные величины, их обработка часто осуществляется с помощью приемов, допустимых на уровне интервальных шкал. То есть большинство исследователей исходят из равенства интервалов между полученными при измерении величинами. Такой подход основывается чаще всего на следующих предпосылках: во-первых, что измеряемая переменная (то или иное свойство объектов) в генеральной совокупности имеет нормальное распределение, и, во-вторых, что различные показатели одной и той же переменной обнаруживают линейную корреляцию. Действительно, на основании этого можно допустить, что интервалы в шкале равны, так как чем более линейна зависимость, тем более равными должны быть интервалы в шкале.
Итак, при конструировании шкалы интервалов используют три произвольные операции: установление величин единиц измерения, определение нулевой точки и определение направления, в котором ведут отсчет по отношению к нулевой точке.
Благодаря равенству единиц на уровне шкал интервалов возможна характеристика формы распределения эмпирических величин с помощью стандартных статистических показателей: средней арифметической величины (М), среднего квадратичного отклонения (σ), показателей симметрии (A) и эксцесса (Ех). Использование линейных преобразований приводит к изменению лишь средней арифметической и / или среднего квадратичного отклонения, не меняя показателей симметрии и эксцесса. Изменение средней арифметической производится прибавлением к каждому первичному результату некоторой постоянной величины: Х1+а...Хn+а. Изменение среднего квадратичного отклонения можно получить, умножая каждое отклонение от средней на постоянную величину: (Xi— М) а, где Xi — первичный результат, М — средняя арифметическая величина, а — константа.
Наиболее частыми линейными преобразованиями, которые находят применение как в области психометрии, так и в области психофизики, Являются центрирование и нормирование результатов измерения. Под центрированием понимается такое линейное преобразование, при котором средняя арифметическая величина становится равной нулю, в то время как направление шкалы и величина ее единиц остаются неизменными. Под нормированием понимают такое линейное преобразование результатов измерения, при котором их средняя арифметическая величина становится равной нулю, а среднее квадратичное отклонение равным ±1. Из сказанного очевидно, что для обработки и анализа эмпирических данных, полученных на уровне шкал интервалов, допустимы любые приемы статистической обработки, а именно расчет основных характеристик распределения, а также меры взаимосвязи количественных переменных (коэффициентов корреляции). В случае наличия нормальных распределений первичных результатов для их сравнения можно применять также все известные критерии оценки значимости различий как между значениями их средних величин, так и дисперсии, т. е. размаха распределения.
Примером интервальных шкал, используемых в психологии, являются стандартизованные тестовые шкалы психодиагностики: шкалы Векслера, шкалы Тёрстена, шкалы С и шкала Т. Гилфорда.
Шкалы отношений.Конструирование шкал отношений предполагает наряду с наличием свойств предыдущих шкал существование постоянной естественной нулевой точки отсчета, в которой измеряемый признак полностью отсутствует. Следовательно, шкалы отношений характеризуются тем, что в них, во-первых, классы объектов разделены и упорядочены согласно измеряемому свойству, во-вторых, равным разностям между классами объектов соответствуют равные разности между приписываемыми им числами в-третьих, числа, приравниваемые классам объектов, пропорциональны Степени выраженности измеряемого свойства. Последнее не было свойственно рассмотренным выше шкалам.
Основными операциями, допустимыми на уровне шкал отношений, являются все те операции, которым подчиняются шкалы всех перечисленных выше типов, и дополнительно — операции установления равенства отношений между отдельными значениями шкалы. Это возможно благодаря существованию на шкале естественного, абсолютного, нуля. Поэтому лишь для данной шкалы числа, являющиеся точками (значениями) на шкале, соответствуют реальному количеству измеряемого свойства, что позволяет производить с ними любые арифметические действия — оперирование суммами, произведениями и частными. Для шкал отношений допустимы любые мультипликативные преобразования типа х' =ах для любых а>0. Однако недопустимы (об этом часто забывают!) никакие операции прибавления или вычитания константных величин, что приводит, как было показано на примере шкал интервалов, к сдвигу точки отсчета. Дополнительно к указанным для описанных выше шкал измерения приемам статистической обработки данных для величин шкалы отношений можно рассчитывать, например, геометрические и гармонические средние, а также коэффициенты изменчивости измеряемого признака.
Считалось, что шкалы отношений не встречаются в психологических измерениях. Однако Стивене, исходя из постулата о допустимости непосредственного измерения психических процессов, показал возможность построения шкал отношений в психофизике. Для этой цели он разработал ряд измерительных процедур, предусматривающих прямое шкалирование. Среди них наиболее известными стали методики фракционирования и мультипликации предъявляемых стимулов. К этой же группе методик можно отнести и методики оценки величин стимулов и непосредственной оценки их отношений. Общим для всех перечисленных методик прямого шкалирования является то, что в качестве измерительного инструмента выступает сам испытуемый, который оценивает количественные отношения между раздражителями.