Надо суметь правду психологического диагноза "точным и непоползновенным порядком вывесть", если следовать логике великого М. В. Ломоносова. Поэтому элементы математического анализа необходимо активно использовать в арсенале практических методов психодиагноста. Приведем простейшие из них, сославшись на аналоговые расчеты медицинской практики [58] и наполнив их психологическим содержанием.
5.1. ОБРАБОТКА РЕЗУЛЬТАТОВ ПСИХОДИАГНОСТИЧЕСКОГО ИССЛЕДОВАНИЯ
В психодиагностике применяют два вида статистического исследования: сплошное и выборочное.
При выборочном статистическом исследованиинаблюдение ведется только за какой-то частью объекта исследования, а полученный результат обобщается применительно к совокупности полной выборки. Поскольку наблюдения не являются сплошными, в них всегда
ожидаются некоторые неточности, называемые ошибкой репрезентативности, которую необходимо учитывать.
Например, в наблюдении обнаружен определенный процент интересующего признака. Возникает вопрос: если провести другие такие же наблюдения, будет ли получен такой же процент интересующего признака? Очевидно, нет. Одни наблюдения дадут меньший процент, другие — больший. Следовательно, в психодиагностических "срезах" часто дать ответы в виде точного показателя, который был бы абсолютной и неизменной характеристикой, нельзя, можно лишь указывать интервал, в пределах которого находится интересующий исследователя процент.
Этот интервал определяется следующим образом.
Его нижняя граница равна Р - А, верхняя — Р + А, где Р — полученный в обследовании процент; А — размер неточности, допущенной вследствие несплошного характера наблюдения.
Размер неточности рассчитывается по формуле
-4
Р(ЮО-Р)
где / — так называемый доверительный коэффициент, с определенной вероятностью указывающий размер А; Р — найденный в диагностике процент случаев; п — количество наблюдаемых случаев.
При Pit) = 0,95 (вероятность ошибочной оценки — 5 %) / = 1,96 ~ 2; при P{t) = 0,99 (ошибка составляет 1 %) / = 2,58; при Pit) = 0,9973 (ошибка составляет 0,27 %) / = 3. Можно и дальше увеличивать значение коэффициента точности. Значение / можно найти в специальной таблице под названием
2 г *-"Значение функции Pit) = -==■ е~2 dt ".
В психологических и педагогических (как и медицинских) исследованиях применяются главным образом и являются практически достаточными в точности измерений указанные ранее значения коэффициента t. Поэтому полную таблицу не будем приводить.
Пример.При наблюдении 100 учащихся 2-го класса с низким темпом чтения выявлено, что 15 из них (т. е. 15 %) не усваивают или плохо усваивают арифметические действия. Необходимо определить
действительный процент плохо усваивающих математику среди детей с низким темпом чтения.
Решение.При доверительном интервале вероятности P(t) = 0,95 и t = 2
д 15(100-15) =
V mo
Интервал, в котором находится истинный процент плохо усваивающих математику среди детей с низким темпом чтения, будет 8-22% (15 ±7%).
Таким образом, с вероятностью 0,95 % можно быть уверенным, что действительный процент плохо усваивающих арифметические действия среди детей, не имеющих навыков чтения, находится в пределах 8-22 %.
Внимание:при увеличении количества наблюдений суждения могут измениться.
Если предположить, что из 400 наблюдаемых детей с такими же дефектами чтения 60 плохо усваивают арифметику, то процент этих детей будет тот же (15 %), но интервал, в котором находится истинный их процент, уменьшится вдвое. Выполним расчет:
400
^=2-1,75 = 3,5; Р + А= 15 + 3,5 = 11,5 <-> 18,5%.
Следовательно, с увеличением количества наблюдений допущенная неточность уменьшается.
В этой связи возникает вопрос: как найти оптимальное количество наблюдений при вычислении статистических показателей относительных величин?
5.1.1. Определение оптимального
количества наблюдений в выборочных психодиагностических исследованиях
Для решения этой задачи формулу
P(IOO-P)
необходимо преобразовать:
_t2P(100-P)
П~ А2 '
Пример.По некоторым предварительным данным, 15 % детей, не освоивших технику чтения, не успевают в арифметике. Необходимо определить, какое количество детей следует пронаблюдать, чтобы неточность А не превышала 4 %, т. е. чтобы интервал истинного процента находился в пределах 11-19%. При этом требуется получить ответ с доверительной вероятностью P(t) = 0,95.
Выполним вычисления:
t2P(l00-P) 2215(100-15)
А242
Следовательно, нужно пронаблюдать около 320 детей. При определении оптимального количества наблюдений можно воспользоваться некоторыми общими правилами.
1. Для уменьшения неточности А в 2 раза количество наблюдений необходимо увеличить в 4 раза, для уменьшения неточности в 3 раза — в 9 раз и т. д.
2. При небольшом количестве наблюдений доверительный интер вал является довольно большим, иными словами, показатели, полу ченные из малых выборок, менее достоверны.
3. Малыми выборками считаются исследования, при которых Рп > 500.
В психодиагностических исследованиях часто возникает необходимость сравнить найденные процентные выражения изучаемого признака у обследованных двух групп испытуемых. Это тем более важно, что в психодиагностиках практически отсутствуют нормативы и сложно судить о том, что "хорошо", а что "плохо".
5.1.2. Сопоставление показателей двух статистических выборок
Пример. Впсиходиагностическом исследовании 7-6 класса было установлено, что из 32 обследованных школьников 5 (15,6%) проявляют неустойчивость внимания — им трудно сосредоточиться и долгое время удерживать произвольное внимание. Необходимо определить, является ли развитие этого свойства внимания в рассматриваемом классе нормальным явлением (так и должно быть) или там наблюдаются задержки в развитии внимания вследствие каких-то закономерных причин.
Решение.Поскольку подобных нормативов нет, нужно провести контрольные исследования. Для этого по той же методике были обследованы 158 семиклассников из разных школ одного региона. В результате обнаружено, что такими же дефектами внимания страдают 11 школьников (7 %). Необходимо определить, является ли разница 15 и 7 % существенной, указывающей на закономерность отличий, или отличия несущественны (а значит, так и должно быть). Заключение должно быть сделано с вероятностью P(t) = 0,95. Иными словами, надо установить, является ли разность в выявленных процентах нарушения свойств внимания такой, которая зависит от случайных причин, или она закономерна, и к 7-6 классу требуется пристальное внимание, направленное на исправление дефектов психического развития.
3. Полученную разность d сравниваем с той, которая могла бы зависеть от действия случайных влияний А. В данном случае
8 % < 20,9 %, т. е. d < A.
Следовательно, процент школьников 7-6 класса, обладающих неустойчивым вниманием, несущественно отличается от процента сверстников, проявляющих такую же неустойчивость внимания.
Примечания: 1. Если d > А, разницу следовало бы признать существенной, статистически значимой.
2. Количество наблюдений в сравниваемых группах может быть одинаковым или различным.
3. Сопоставлять проценты с помощью описанного метода мож но только при соблюдении условия
Рп > 500.
Проверим это условие:
Р' =15,6; л, = 32; Р'л, = 499,2, что равно 500,
Р"=1; п2= 158; Р"п2= 1106.
Условие выполняется, т. е. 1106 > 500, а значит, сравнивать эти выборки можно.
На практике количество наблюдений, необходимых для сравнения двух выборок, следует определять еще до проведения диагностических исследований. Поэтому нужно уметь рассчитывать это количество.
5.1.3. Оптимальное количество наблюдаемых случаев, необходимое для сравнения двух показателей относительной доли
Рассмотрим два варианта расчета.
Вариант I.Когда количество требуемых наблюдений в обеих группах одно и то же (основная и контрольная группы количественно равны), т. е. я, = п2= п.
В таком случае оптимальное количество наблюдений определяют из преобразования формулы
IF(IOO-F) Р"(100-Р")
к виду
_ t2F (100-F)+ t2P" (100-Р")
где А — предполагаемая разность между показателями, т. е. А = Р' -- Р"; п — необходимое количество наблюдений в каждой из групп; Р', Р" — предполагаемое значение показателя относительной доли в группе соответственно первой и второй.
Вариант П.Когда по практическим соображениям количество наблюдаемых лиц в группах разное, т. е. я, Ф п2.
И в этом случае выполняют те же преобразования с формулой (1), но из-за разных знаменателей (п1 Ф п2) эта формула приобретает вид
t2P'(l00-P') п,=-
л7t2P"(l00-P")'
А 2 "
«2
Примечания: 1.Количественный состав группы либо намечается исследователем по возможности, т. е. исходя из реальных условий, либо рассчитывается на уровне оптимального.
2. Количество необходимых наблюдений минимально, если
Щ _ yl п2 ~ yl
а поскольку на практике, как правило, Р'~ Р", то обычно минимальное количество необходимых наблюдений п. = п..
1 L
3. На практике к неравномерным выборкам прибегают лишь тогда, когда это дает явные преимущества в организации и стоимости эксперимента.
Указанные формулы для оценки и сравнения показателей относительной доли используют только в случае больших по объему выборок испытуемых, т. е. когда Рп > 500.
Пример.Во время педагогической практики студент или учитель-новатор решил проверить результативность нетрадиционных форм развивающего обучения в ряде классов по своему предмету. Он исходил из того, что эффективность его развивающего обучения будет повышаться по мере взросления учеников, т. е. с учетом естественного онтогенеза психических функций, а именно по мере созревания мыслительных операций абстрагирования. Требуется сравнить на уровне статистической доверительности P(t) = 0,95 выразительность психодидактического влияния новой разработки уроков на интеллектуальное совершенствование девятиклассников.
При этом экспериментатор знает, что в 7-м классе относительная часть учеников, прогрессирующих в умственном развитии, устойчиво составляет 30 %, а в 9-м классе их предположительно должно быть не менее 50 % (Р' = 30 %; Р" = 50 %). В 7-м классе у него обучается 27 учеников (п1= 27). Сколько нужно включить в эксперимент девятиклассников, чтобы достичь ожидаемого результата?
Решение.
1.Проверим статистическую доверительность выборки 7-го клас са: /"л7= 30-27 = 810, что превышает 500, а значит, выборка способ на удовлетворить критерий достоверности.
2. Находим предполагаемую разность между показателями 7-го и 9-го классов: А = Р" - Р' = 50 - 30 = 20.
3. Воспользуемся формулой для определения п и вычислим это значение:
t2P'(l00-P') _ 2230(100-30)
12t2P"(l00-P") 22-50(100-50) 386,3
2 ТТ2
И! 27
4.Проверим доверительность выборки девятиклассников: Р"п2= = 50 ■ 22 = 1100, что превышает 500, а значит, выборка статистически достоверна.
Ответ.Для проверки гипотезы в психолого-педагогический эксперимент необходимо включить 22 девятиклассника.
5.2. ВАРИАиИОННЫЙ АНАЛИЗ ПСИХОЛИАГНОСТИЧЕСКОГО ИССЛЕДОВАНИЯ
Изучая психические явления, замечаем, что наблюдаемые показатели различаются по выраженности своих признаков. Такие различия называются вариациями, а показатели обретают смысл как вариативные.
Существует множество причин, вызывающих вариации. В наиболее общей форме различают две группы причин:
• определяющие, т. е. в основе которых лежат закономерности, тенденции порядка следования, весомости и объемности описываемых явлений;
ПО
• неопределяющие, т. е. представляющие собой в измерениях динамику, разновидности, формы проявления закономерных процессов в изучаемых явлениях.
Перед математической статистикой стоят задачи измерить и охарактеризовать действие обеих групп причин, которые фиксируются психодиагностическим инструментарием в тех или иных показателях.
К измерениям, определяющим причины изучаемых явлений, которые фиксируют величину конкретного признака, относятся средние значения: Ха—средняя арифметическая величина; Хт—медиана; Хг— средняя геометрическая величина; ХтЫ— статистическая мода.
К измерениям второго порядка, отражающим неопределяющие причины, относятся с — среднеквадратическое отклонение, или показатель дисперсии; R — амплитуда, или размах вариативного ряда; v — коэффициент вариации.
5.2.1. Средняя арифметическая величина
Показатель средней арифметической величины X признака — это частное от деления всех переменных на ее объем, т. е.
В развернутом виде
— =Хх+ Х2+ ХЪ+ ■■■+%„
Таким образом, в случае небольшого количества первичных результатов значение средней арифметической величины получают последовательным суммированием исходных величин х. с последующим делением этой суммы на общее количество исходных данных п.
Как отмечалось, в большинстве случаев психологические исследования проводят выборочно. Это означает, что реально наблюдают только относительно малую часть всех возможных факторов изучаемого явления, а полученные результаты и соответствующие статистические показатели обобщают для совокупности. Однако само по себе среднее значение изучаемого признака в его вариациях мало информативно для характеристики совокупности.
Поэтому при использовании среднего значения прибегают к так называемым мерам изменчивости. Но прежде следует пояснить понятие распределения результатов, показателей, значений.
Распределение показателей, полученных в эмпирических психологических и психодиагностических исследованиях, при большом количестве наблюдений обычно приближается к нормальному. Это такой вид теоретического распределения переменных, который наблюдается при изменении признака (переменной) под влиянием множества относительно независимых факторов. Графическое изображение нормального распределения представляет собой симметричную колоколообразную кривую, осью симметрии которой является средняя арифметическая величина измеряемого признака (рис. 1).
На практике важное значение имеет вычисление площади слева от любой точки на оси абсцисс, ограниченной участком нормальной кривой и ординатой этой точки. Поскольку площадь стандартного нормального распределения равна единице, то доля этой площади отражает частоту случаев с х., меньшими, чем данное значение на оси X. В математической статистике используется нормальное распределение в качестве стандартизации эмпирических выборок со следующими характеристиками: X = 0; а = 0; площадь под нормальной кривой равна единице. Такое распределение называется нормальным. Для любого нормального распределения в пределах х. Х±а находится около 68 % площади под кривой, в пределах Х±2о — около 95 %, в пределах Х±3а — около 99,7 %. Количество случаев в пределах стандартного отклонения можно легко определить без
расчетов: в интервале оценок, соответствующих -2с и -с, находится 13,6 % обследованных (рис. 1).
От всех возможных распределений нормальное отличается такими свойствами: оно однозначно описывается двумя параметрами — средней арифметической величиной X и среднеквадратичным отклонением а, или дисперсией а2.
5.2.2. Меры изменчивости. Дисперсия
и среднеквсшратическое отклонение. Ошибка среднего значения
В качестве мер изменчивости результатов, характеризующих степень рассеивания отдельных величин вокруг средней арифметической, используются разные показатели в зависимости от характера измерений (дискретные или непрерывные признаки). Для характеристики рассеивания величин интервальных шкал и шкал отношений (для дискретных измерений) используют значение среднеквадрати-ческого отклонения си дисперсии а1.
Показатели дисперсии дают обобщенную характеристику влияния индивидуально и случайно действующих причин в каждом конкретном случае: они показывают степень рассеивания, или степень вариации измеряемых признаков вокруг среднего, типичного уровня.
Дисперсия — это среднее арифметическое значение квадрата центральных отклонений от среднего, которое вычисляется по формуле
где х. — выражение каждого замера признака; X — средняя арифметическая величина выборки.
Легко догадаться, что среднеквадратическое отклонение с есть корень квадратный из дисперсии.
Покажем это на условном примере. Материалы конкретного обследования приведены в табл. 4. Для удобства несгруппированные показатели также занесены в табл. 4.
Расчеты осуществляют в следующем порядке.
1. Рассчитывают среднюю арифметическую величину и ее значение записывают под графой х..
Таблица 4 Расчет дисперсии а2и среднеквадратического отклонения а при и = 10
№ п/п
Xcmui
*откл
0,2
0,04
-3,8
14,44
-1,8
3,24
2,2
4,84
0,2
0,04
2,2
4,84
-3,8
14,44
0,2
0,04
2,2
4,84
2 2
4,84
Г = 13,2
£^ткл= 51,60
2. Определяют отклонение хоткл каждого результата измерения х от средней арифметической величины: хоткл= х- X.
3. Возводят в квадрат найденное значение отклонения каждого результата от среднего: хоткл.
4. Суммируют значения квадратов отклонений всех результатов.
Полученную сумму записывают под графой х2откл: £х„ткл = 51,60.
5. Сумму квадратов отклонений делят на общее количество на блюдений лив итоге получают искомую величину, которая называ ется дисперсией: а2= 51,60 : 10 = 5,16. Этот развернутый алгоритм решения компактно записан в виде формулы (2).
6. Извлекают корень квадратный из дисперсии и получают вели чину стандартного, или среднеквадратического, отклонения:
а = 75Д6=2,27.
Если средняя арифметическая величина является центральной тенденцией измеряемого признака, его представительством, сжатой характеристикой, то среднеквадратическое отклонение указывает на меру рассеивания отдельных инвариант изучаемой выборки. Наряду со стандартным отклонением (а) мера рассеивания еще характеризуется вероятной ошибкой, или, как ее еще называют, ошибкой выборки (т).
Естественно, что при переносе выборочных данных на обобщения по совокупности допускается некоторая ошибка среднего значения, которая статистически зависит от внутренней плотности (рассеивания) единичных показателей, характеризующих измеряемое явление. Поэтому ошибку среднего значения используют в том же назначении, что и среднеквадратическое отклонение — для характеристики однородности изучаемого явления. Ошибка выборки (среднего значения с определенной степенью вероятности)
где / — коэффициент, указывающий на вероятность того, что полученное значение ошибки не будет превышать значение действительной ошибки, допущенной вследствие несплошного наблюдения; а— среднеквадратическое отклонение, характеризующее рассеивание в общей совокупности полученных данных; п — количество наблюдаемых случаев в выборке.
Пример.Воспользуемся данными некоторого измеряемого процесса психики, которые представлены в табл. 4. Исходя из этих данных количественные проявления изучаемого процесса характеризуются средним значением X на уровне 13,2 условной единицы при сигмальном разбросе индивидуальных значений, т. е. среднеквадра-тическом отклонении отдельных инвариант с = 2,27. Следует определить, в границах какого интервала находится истинная средняя величина изучаемого признака для генеральной совокупности явлений, выражающих зафиксированные в данном измерении свойства изменчивости конкретных показателей. Вероятность найденных границ должна быть на уровне P(t) = 99 %, т. е. / = 2,58.
Решение.Нижняя граница определяется соотношением X—т, верхняя — соотношением X + т.
Рассчитываем:
Ш 2,58-2,27 5,86
т = —г= = = = 1,86;
4п Ю 3,16
X -а = 13,2 -1,85 = 11,35; X + а = 13,2 + 1,85 = 15,05.
Это означает, что среднее значение истинных показателей в эксперименте, данные которого представлены в табл. 4, находится в пределах 11,35 - 15,05, или, как это фиксируется в записях, X = 13,2 ± ± 1,85 при а = 2,27.
Такое сопровождение средней арифметической величины представляет его не как абстрактную величину, а как количественный показатель, характеризующий некоторую своеобразно устроенную совокупность данных.