1. Сравнение двух независимых выборов. Критерий Манна-Уитни.
Попытаемся выяснить, различаются ли девушки и юноши по успеваемости в выпускном классе.
Ranks
пол
Количество
Средний ранг
Сумма рангов
отметка2
ЖЕН
56,21
3429,00
МУЖ
41,56
1621,00
Total
Средний ранг для девушек равен 56,21, а для юношей 41,56. Это значит, что у девушек успеваемость выше, чем у юношей.
Test Statisticsa
отметка2
Манна-Уитни U
841,000
Уилкоксон W
1621,000
Z
-2,469
Коэффициент значимости
,014
При этом уровень значимости равен 0,014. Это значительно меньше 0,05. Мы можем быть уверены в статистической достоверности о том, что успеваемость девушек выше, чем у юношей.
2. Зависимые выборки.
2.1. Критерий знаков.
Сравним результаты учащихся по второму тесту и четвертому.
Frequencies
N
осведомленность - числовые ряды
Negative Differencesa
Positive Differencesb
Tiesc
всего
a. осведомленность < числовые ряды
b. осведомленность > числовые ряды
c. осведомленность = числовые ряды
Полученные результаты, говорят о том, что в 39 случаях значение переменной «тест 2», оказались меньше, чем значение переменной «тест 4». В 57 случаях значения переменной «тест2» оказались больше, чем значение переменной «тест4». И в 4 случаях значение переменной «тест2» равен значению «тест4».
Test Statisticsa
осведомленность – числовые ряды
Z
-1,735
Коэффициент значимости
,083
a. Sign Test
При этом уровень значимости равен 0,083. Это значительно больше 0,05. Мы не можем быть уверены в том, что различия между тестом 2 и тестом 4 достоверны.
2.2. Значение переменной Уилкоксона.
Ranks
количество
Средний ранг
Сумма рангов
осведомленность – числовые ряды
Negative Ranks
39a
42,26
1648,00
Positive Ranks
57b
52,77
3008,00
Связь
4c
Всего
a. осведомленность < числовые ряды
b. осведомленность > числовые ряды
c. осведомленность = числовые ряды
Полученные результаты, говорят о том, что в 39 случаях значение переменной «тест 2», оказались меньше, чем значение переменной «тест 4». В 57 случаях значения переменной «тест2» оказались больше, чем значение переменной «тест4». И в 4 случаях значение переменной «тест2» равен значению «тест4».
Test Statisticsa
осведомленность – числовые ряды
Z
-2,493b
Коэффициент значимости
,013
a. Wilcoxon Signed Ranks Test
b. Based on negative ranks.
При этом уровень значимости равен 0,013. Это значительно меньше 0,05. Мы можем быть уверены в статистической достоверности о том, что есть различия между «тестом2» и «тестом4» .
3. Критерий серий.
Проверим гипотезу о неслучайном чередовании юношей и девушек в списке испытываемых.
Runs Test
пол
Test Valuea
2,00
Всего случаев
Number of Runs
Z
,089
Коэффициент значимости
,929
a. User-specified.
Большое значение уровня значимости (0,92) свидетельствует о том, что чередование юношей и девушек является случайным.
4. Биномиальный критерий
Попытаемся выяснить, является ли распределение мужчин и женщин в выборке биноминальными.
Binomial Test
Категория
Количество
Наблюдаемая пропорция
Ожидаемая пропорция
Коэффициент значимости
пол
Группа 1
МУЖ
,39
,50
,035
Группа 2
ЖЕН
,61
Total
1,00
Ожидаемая пропорция для биноминального теста (0,50). Как можно видеть, наблюдаемая пропорция, значительно отличается от 0,5 и составляет 0,39 от 0,61. Уровень значимости равный 0,035 (меньше 0,05), свидетельствует о статистически достоверном отличии исследуемого распределения от биноминальной (равновероятностного).
5. Критерий хи-квадрат
Применение хи-квадрата применим к переменной ВУЗ. Поскольку число объектов равно 100, а переменная ВУЗ имеет 4 градации, то ожидаемые частоты для каждой группы будут равны 25
вуз
Фактическая частота
Ожидаемая частота
Остаток
ГУМ
25,0
-3,0
ЭКОН
25,0
6,0
ТЕХН
25,0
-14,0
ЕСТ_Н
25,0
11,0
Всего
Между ожидаемыми и наблюдаемыми показателями наблюдается значительное различие.
Test Statistics
вуз
Chi-Square
14,480a
df
Коэффициент значимости
,002
a. 0 cells (0,0%) have expected frequencies less than 5. The minimum expected cell frequency is 25,0.
Уровень значимости равный 0,002 (меньше 0,05) свидетельствует о статистически достоверном отличие наблюдаемого распределения от равномерного распределения
Проверим сравнение трех групп учащихся, отличающихся внешкольными увлечениями (переменная хобби) и успеваемостью в выпускном классе (переменная отметка2).
Ranks
хобби
Количество
Средний ранг
отметка2
спорт
38,18
компьютер
54,28
искусство
59,38
всего
Test Statisticsa,b
отметка2
Chi-Square
9,437
df
Коэффициент значимости
,009
a. Kruskal Wallis Test
b. Grouping Variable: хобби
Результаты обработки данных показывают статистически достоверную связь внешкольных увлечений с успеваемостью в выпускном классе.
Домашняя работа. Линейный тренд.
Приведены данные об объеме ежемесячной выручки продаж частного предприятия за 15 месяцев.
1. Определить параметры линейного тренда
2. Дать экономическую интерпретацию полученных параметров модели
3. Рассчитать прогнозный уровень выручки за 16 месяц
N
Y
t
Y*t
t^2
21,34
-7
-149,38
23,41
-6
-140,46
25,31
-5
-126,55
24,2
-4
-96,8
28,56
-3
-85,68
32,21
-2
-64,42
35,24
-1
-35,24
31,43
45,78
45,78
43,58
87,16
53,76
161,28
51,87
207,48
68,71
343,55
74,25
445,5
86,45
605,15
итого
646,1
1197,37
Уравнение линейного тренда имеет вид:
Для расчета необходимо найти a0 и a1, с учетом промежуточных данных получаем:
тысяч рублей
тысяч рублей
Следовательно, уравнение линейного тренда имеет вид:
Согласно полученной модели, оценка среднего уровня ряда при t = 0 составляет 430733 рублей, а среднемесячный абсолютный прирост выручки от продаж частного предприятия равен 42763 рублей.
Для прогнозирования по линейной модели на одну точку вперед необходимо в полученное выражение подставить соответствующее значение временного параметра tпр = 8, соответствующее реальному значению t* = 16.
Прогнозное значение выручки от продаж за 16-й месяц составит:
тысяч рублей
рублей
Дисперсионный анализ.
Выдвинем две гипотезы h0:
1. Различия в средней урожайности пшеницы, вызванные влиянием типа удобрения (фактор А), выражены не более чем различия, обусловленные случайными причинами;
2. Различия в средней урожайности пшеницы, вызванные влиянием сорта (фактор В), выражены не более чем различия, обусловленные случайными причинами.
Descriptive Statistics
Удобрение
сорт
Средняя
Удобрение А
сорт 1
16,5000
сорт 2
24,7500
сорт 3
16,5000
сорт 4
5,5000
сорт 5
16,5000
Total
15,9500
удобрение Б
сорт 1
11,0000
сорт 2
19,2500
сорт 3
22,0000
сорт 4
8,2500
сорт 5
13,7500
Total
14,8500
удобрение В
сорт 1
24,7500
сорт 2
8,2500
сорт 3
27,5000
сорт 4
19,2500
сорт 5
11,0000
Total
18,1500
удобрениеГ
сорт 1
22,0000
сорт 2
11,0000
сорт 3
38,5000
сорт 4
11,0000
сорт 5
27,5000
Total
22,0000
удобрениеД
сорт 1
41,2500
сорт 2
30,2500
сорт 3
35,7500
сорт 4
24,7500
сорт 5
38,5000
Total
34,1000
удобрение Е
сорт 1
33,0000
сорт 2
38,5000
сорт 3
41,2500
сорт 4
30,2500
сорт 5
24,7500
Total
33,5500
Total
сорт 1
24,7500
сорт 2
22,0000
сорт 3
30,2500
сорт 4
16,5000
сорт 5
22,0000
Total
23,1000
На участке номер 1, где участвует «удобрение А», средняя урожайность составила 16,50, на участке номер 2 с «удобрением А» средняя урожайность составила 24,75. На первом участке, где участвует «удобрение Б», средняя урожайность составила 11,00, а на втором участке с тем же удобрением 19,25.
Внутригрупповая дисперсия
Source
Type III Sum of Squares
df
Mean Square
F
Уровень значимости
Partial Eta Squared
Corrected Model
2474,450a
274,939
6,162
,000
,735
16008,300
16008,300
358,780
,000
,947
Удобрение
1875,500
375,100
8,407
,000
,678
сорт
598,950
149,738
3,356
,030
,402
Error
892,375
44,619
Всего
19375,125
Corrected Total
3366,825
a. R Squared = ,735 (Adjusted R Squared = ,616)
Оба фактора и сорт, и удобрение, оказывают статистически достоверное влияние на урожайность, так как уровень значимости составляет 0,000 и 0,03 (меньше 0,05). Мы можем предположить, что удобрение оказывает большее влияние, нежели сорт.
Multiple Comparisons
(I) Удобрение
(J) Удобрение
Коэффициент значимости
Удобрение А
удобрение Б
1,000
удобрение В
,998
Удобрение Г
,836
Удобрение Д
,016
удобрение Е
,020
удобрение Б
Удобрение А
1,000
удобрение В
,986
Удобрение Г
,720
Удобрение Д
,009
удобрение Е
,012
удобрение В
Удобрение А
,998
удобрение Б
,986
Удобрение Г
,972
Удобрение Д
,042
удобрение Е
,053
удобрениеГ
Удобрение А
,836
удобрение Б
,720
удобрение В
,972
Удобрение Д
,195
удобрение Е
,236
удобрениеД
Удобрение А
,016
удобрение Б
,009
удобрение В
,042
Удобрение Г
,195
удобрение Е
1,000
удобрение Е
Удобрение А
,020
удобрение Б
,012
удобрение В
,053
Удобрение Г
,236
Удобрение Д
1,000
По данной таблице можно сделать вывод, что удобрение Д и удобрение Е оказывает большое влияние, так как коэффициент значимости минимальный. А удобрения А и Б оказывают меньшее влияние.
Урожайность
Scheffea,b
Удобрение
Количество
Подмножество
удобрение Б
14,8500
Удобрение А
15,9500
удобрение В
18,1500
18,1500
удобрениеГ
22,0000
22,0000
22,0000
удобрение Е
33,5500
33,5500
удобрениеД
34,1000
Sig.
,720
,053
,195
Means for groups in homogeneous subsets are displayed.
Based on observed means.
The error term is Mean Square(Error) = 44,619.
a. Uses Harmonic Mean Sample Size = 5,000.
b. Alpha = ,05.
Данную совокупность можно разбить на 3 подмножества. Подмножество 3 оказывает наибольшее влияние, в него входят удобрения Г,Е и Д( 22,00; 33,55; 34,1 соответственно). Подмножество 2 оказывает средне влияние, в него входят удобрения В,Г и Е (18,1; 22,00; и 33,5 соответственно). Подмножество 1 оказывает наименьшее влияние, в него входят удобрения А, Б, В, Г (15,95; 14,85; 18,1; 22 соответственно).
Multiple Comparisons
Dependent Variable: Урожайность
Scheffe
(I) сорт
(J) сорт
Коэффициент значимости
сорт 1
сорт 2
,971
сорт 3
,730
сорт 4
,365
сорт 5
,971
сорт 2
сорт 1
,971
сорт 3
,365
сорт 4
,730
сорт 5
1,000
сорт 3
сорт 1
,730
сорт 2
,365
сорт 4
,036
сорт 5
,365
сорт 4
сорт 1
,365
сорт 2
,730
сорт 3
,036
сорт 5
,730
сорт 5
сорт 1
,971
сорт 2
1,000
сорт 3
,365
сорт 4
,730
По данной таблице можно сделать вывод, что сорт 3 оказывает большее влияние на урожайность, так как коэффициент значимости имеет меньшие показатели.
Урожайность
Scheffea,b
сорт
N
Subset
сорт 4
16,5000
сорт 2
22,0000
22,0000
сорт 5
22,0000
22,0000
сорт 1
24,7500
24,7500
сорт 3
30,2500
Sig.
,365
,365
Данную совокупность можно разделить на 2 подмножества. Второе подмножество оказывает большее влияние, в него входят сорт 2,5,1 и 3.
Первое подмножество оказывает меньшее влияние, в него входит сорт 4.
На данном графике видно, что большее влияние на урожайность оказывает 3 сорт, а наименьшее влияние оказывает 4 сорт. Удобрение А, Б и В оказывает наименьшее влияние на урожайность, а удобрения Д и Е наибольшее влияние.