Точный тест Фишера – это тест статистической значимости, используемый в анализе категориальных данных, когда размеры выборки малы. Назван в честь его изобретателя, Р. A. Фишера, и является одним из класса точных тестов. Фишер разрабатывал тест после комментария от Muriel Bristol, которая утверждала, будто была в состоянии обнаружить, были ли чай или молоко добавлены сначала в ее чашку.
Тест обычно используется, чтобы исследовать значимость взаимосвязи между двумя переменными в факторной таблице размерности 2 x 2 (таблице сопряженности признаков). Величина вероятности P теста вычисляется, как если бы значения на границах таблицы известны. Например, в случае с дегустацией чая, госпожа Bristol знает число чашек с каждым способом приготовления (молоко или чай сначала), поэтому якобы предоставляет правильное число угадываний в каждой категории.
С большими выборками в этой ситуации может использоваться тест хи-квадрат. Однако, этот тест не является подходящим, когда математические ожидания значений в любой из ячеек таблицы с заданными границами оказывается ниже 10: вычисленное выборочное распределение испытуемой статистической величины только приблизительно равно теоретическому распределению хи-квадрат, и приближение неадекватно в этих условиях (которые возникают, когда размеры выборки малы, или данные очень неравноценно распределены среди ячеек таблицы). Тест Фишера, как следует из его названия, является точным, и поэтому может использоваться независимо от особенностей выборки.
Для ручных вычислений тест выполним в только случае размерности факторных таблиц 2 x 2. Однако принцип теста может быть расширен на общий случай таблиц m x n, и некоторые статистические пакеты обеспечивают такие вычисления.
Зависимые выборки.
Используется критерий Мак-Нимара (Макнамары). Применяется если одна и та же выборка классифицируется по некоторому признаку дважды, но в различных условиях.
Критерий Мак-Нимара
Результаты записываются в виде таблицы сопряженности:
Измерение 2
Значение 1
Значение 2
Измерение 1
Значение 1
a
b
Значение 2
c
d
В данной таблице
· a – количество объектов выборки, у которых и при первом, и при втором измерении было значение 1;
· d – количество объектов выборки, у которых и при первом, и при втором измерении было значение 2;
· b – количество объектов выборки, у которых при первом измерении было значение 1, а при втором – значение 2;
· c – количество объектов выборки, у которых при первом измерении было значение 2, а при втором – значение 1.
Гипотезы:
· Н0– ОТСУТСВУЮТ ЗНАЧИМЫЕ РАЗЛИЧИЯ В СООТВЕТСТВ ИЗУЧАЕМОГО СВОЙСВА
· Н1– РАЗЛИЧНО В ДАННЫХ ВЫБОРКАХ
При проверке гипотезы различают 2 случая:
1) если , то находится , . По таблице вероятностей для биномиального распределения находится Мэмп. Критическое значение для этого случая постоянно. Оно равно : . Нулевая гипотеза отвергается, если наблюдаемое значение меньше критического.
2) если , то Мэмп. . Критическое значение находится по таблице критических точек распределения с числом степеней свободы f = 1 и уровнем значимости . В этом случае критерий правосторонний.
Ограничения критерия:
-ИЗМЕНЕНИЯ В ДИХОТОМИЧЕСКОЙ ШКАЛЕ
-ВЫБОРКИ ЗАВИСИМЫ (В НЕ РАВНО С)
Пример. Школьный психолог проводит эксперимент по выявлению эффективных форм профориентационной работы. С этой целью он использует различные формы – лекции, беседы, экскурсии и т.п. Чтобы установить эффективность выбранной формы проводился опрос: «Нравится ли профессия экономиста?» у 20 учащихся до лекции об этой профессии и после лекции. Результаты приведены в таблице:
2 опрос (после лекции)
нравится
не нравится
1 опрос
(до лекции)
нравится
не нравится
Можно ли считать данную форму профориентационной работы эффективной?
Решение.
Пример. Исследуются различия в успешности решении двух разных по сложности мыслительных задач. Группа из 120 учащихся решала эти задачи. Результаты приведены в таблице: