Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Отбор данных. Модификация данных. Проверка репрезентативности



Отбор данных — это выбор случаев по определенным критериям; так, например, нужно отобрать только мужчин с высшим образованием, женщины до 50 лет, пенсионеров и т.д. После этого все операции будут проводиться только с этими отобранными случаями.

Для этого в SPSS существует три принципиальные возможности:

• Выбор случаев по определенному условию (логическому выражению),

• Извлечение случайной выборки случаев из файла данных,

• Разделение случаев на группы в соответствии со значениями одной или нескольких переменных.

Задание.

Отобрать данные по условиям, представленным в задании (на примере файла Region.sav). Вывести на экран частотные таблиц, созданные с учетом определенных условий. Извлечь случайную выборку из файла (10%), выполнить сортировку данных по какой-либо переменной (на примере файла Region.sav). Разделить случаи на группы по определенному признаку. Вычислить новую переменную на основе уже созданных переменных. Перекодировать значения переменных. Проанализировать результаты.

Пример выполнения 1 (отбор данных)

Отобрать респондентов с родом занятий студенты (переменная А1=7). Выполнить частотный анализ по переменной настроение (А2). Выполняем следующие действия:

1) Выполнить команду Данные–Отобрать наблюдения

2) Для ввода условия выбирается пункт Если выполнено условиеи выполняется щелчок на кнопке Если….

3) В левом поле найти переменную Род занятий (А1) и перенести ее в Редактор условий дважды щелкнув на ней или выделив ее и щелкнув на кнопке с треугольником.

4) Значение переменной, соответствующей студентам, закодировано цифрой «7», поэтому в редакторе условий с клавиатуры компьютера или клавиатуры данного диалогового окна после переменной А1 записывается выражение «=7» (рис. 2.1).

Рис. 2.1

5) Выбор подтверждается кнопкой Продолжить. Происходит возврат в диалоговое окно Отобрать наблюдения.

6) Нажимается кнопка OK и происходит переход в Редактор данных.

На листеПредставление Данные можно увидеть, что номера строк, не соответствующих условиям отбора перечеркиваются. При проведении частотного анализа в выборку войдут только студенты.

Пример выполнения 2

(отбор данных: извлечение случайной выборки)

Извлечь из файла Region.sav случайную выборку 10%. Выполняется следующий порядок действий:

1. Выполняется команда Данные– Отобрать наблюдения.

2. В открывшемся диалоговом окне Отобрать наблюдениянажмите кнопкуСброс и ОК, для того чтобы сбросить предыдущий отбор наблюдений

3. Выполняется команда Данные– Отобрать наблюдения.

4. В открывшемся диалоговом окне Отобрать наблюдениявыбрать пункт Случайная подвыборка, а затем щелкнуть на кнопке Подвыборка.

5. В окне Отобрать наблюдения: Случайная подвыборка в группу Примерно вводится число 10.

Пример для выполнения пункта задания 3

(отбор данных: разделение по группам)

Рассмотрим разделение на группы в файле Region.sav. Необходимо разбить файл на группы по переменной И3 (образование). Возможно два варианта выполнения данного задания:

1) Выполняется команда по разделению файла Данные – Файл разбиения.

2. В диалоговом окне Расщепить файл выбрать пункт Сравнить группы.

3. Далее находится переменная Образование (И3), выделяется и переносится в поле Группы образуются по.

Во втором варианте выполнения вместо пункта Сравнить группы выбирается настройка Организовать вывод по группам.

В первом случае результаты частотного анализа будут помещаться в одну таблицу. Во втором случае в отдельные таблицы.

Пример для выполнения пункта задания 4

(отбор данных: разделение по группам)

Выполним сортировку по возрастанию по переменной Настроение (А2). Выполняется последовательность действий:

1. Выполняется команда Данные – Сортировканаблюдений.

2. После выполнения команды открывается диалоговое окноСортировка наблюдений, в котором указывается переменная А2.

3. В группе порядок устанавливаем способ сортировки: по возрастанию.

4. После нажатия кнопки ОК на листе Данные выполняется сортировка случаев по переменной А2.

Пример для выполнения пункта задания 5

(модификация данных: перекодирование значений)

Для примера ручного перекодирования (с изменением значений текущей переменной) рассмотрим файл Region.sav. Исходная переменная Настроение (А2) имеет 4 значения (1 – оптимистическое, 2 – нормальное, 3 – раздражение, 4 – страх). Из четырех типов ответов необходимо сформировать два типа: 1 – хорошее (на основе 1 и 2), 2 – плохое (на основе 3 и 4). Для выполнения данного задания выполняются следующие действия:

1. Выполняется команда Преобразование –Перекодировать вте же переменные

2. В открывшемся диалоговом окне Перекодировать в те же переменныевыделить переменную А2 и перенести ее в поле Переменные.

3. Чтобы установить значения, которые необходимо перекодировать следует щелкнуть на кнопке Старые и новые значения.

4. В открывшемся диалоговом окне Перекодирование в те же переменные: стране и новые значения вводим старые значения (группа Старое значение) и определяем соответствующие новые значения (группа Новое значение). В нашем примере старым значениям 1 и 2 будет соответствовать новое значение 1, старым значениям 3 и 4 будет соответствовать новое 2. Группы 1 и 2, 3 и 4 можно записать в виде диапазона или по отдельности (рис 2.2).

Рис. 2.2

5. После ввода всех значений необходимо щелкнуть на кнопке Продолжить, затем на кнопке ОК(рис. 5.11). На листе переменные задаются новые значения для переменной А2.

Вместо перекодирования в эти же переменные можно выполнять перекодирование в новые переменные.

 

Пример для выполнения пункта задания 6

(модификация данных: вычисление новых переменных )

Рассмотрим предыдущий пример (переменная Настроение – А2), вместо перекодирования в те же переменные вычислим новые переменные. Для этого выполняется следующая последовательность действий.

1) Для создания новой переменной выполняется команда Преобразование – Вычисление переменной.

2) В открывшемся диалоговом окне Вычислить переменную. слева в поле Целевая переменная вводится имя новой переменной а2_new, справа в поле Числовое выражение ее первое значение – «1».

3) Для ввода условия выполняется щелчок на кнопке Если….

4) В открывшемся диалоговом окне Вычислитьпеременную: отбор наблюденийвыбрать пункт включить наблюдения, удовлетворяющиеусловиюи ввести соответствующее условие отбора (рис. 2.3).

Рис. 2.3

5) Щелкнуть на кнопке Продолжить, затем на кнопке ОК.

6) На листах Представление Данныеи Представление Переменные можно увидеть новую переменную А2_new.

7) Для ввода значения «2» повторяется команда Преобразование – Вычисление переменной, в открывшемся диалоговом окне Вычислить переменнуюслева в поле Целевая переменная появляется имя новой переменной, справа в поле Цифровое выражение вводится ее второе значение – «2», предыдущее значение «1» необходимо удалить. Для ввода условия выполняется щелчок на кнопке Если

8) В открывшемся диалоговом окне Вычислить переменную: отбор наблюдений выбрать пункт включить наблюдения, удовлетворяющие условиюввести соответствующее условие отбора а1=3| а1=4.

9) Щелкнуть на кнопке Продолжить, затем на кнопке ОК. В появившемся окне щелкнуть на кнопке ОК.

10) На листе переменные ввести соответствующие параметры переменной – число знаков, имя и внести значения переменной, указанные выше.

 

Пример пункта задания 7

(модификация данных: агрегирование данных)

На основе данных файла posobia.sav, который содержит данные о выдаче пособий в трех отделениях Фонда социального страхования (Тюменское, Тобольское, Ишимское), вычислить общую сумму выданных пособий по каждому отделению.

1. Открываем файл posobia.sav.

2. На листе Переменные представлены характеристики переменных (рис. 2.4).

Рис. 2.4

3. Для вычисления общей суммы пособий по каждому отделению выполняется команда Данные – Агрегировать данные.

4. Выводится диалоговое окно Агрегирование данных (рис. 2.5), в поле Группирующие переменные вносим переменную Отделение (Otd), в поле Итоги для переменных переменную Размер пособия (PS), которой присваивается новое имя (рис. 2.5).

5. По умолчанию в качестве функции агрегирования принято среднее значение, для выбора суммы необходимо щелкнуть на кнопке Функции…и в открывшемся диалоговом окне (Агрегировать данные: агрегирующая функция) выбрать нужную функцию Сумма.

Рис. 2.5

6. По умолчанию для вывода результатов агрегирования создается новый файл, имя которого по умолчанию aggr.sav. Можно изменить имя, щелкнув на кнопке Файл…, вводим новое имя posobia_agr.sav.

Пример выполнения 8

(модификация данных: коррекция при отсутствии репрезентативности)

В выборке 46,7% мужчин, 53,3 % женщин (файл Region.sav, переменная И1); репрезентативной является выборка с 49% мужчин и 51% женщин. Путем взвешивания попробуем скорректировать имеющееся искажение. Для мужчин весовой коэффициент равен 49/46,7, а для женщин 51/53,3. Для создания данных весовых коэффициентов выполняется следующая последовательность шагов:

1. Выполняется команда Преобразование – Вычислить переменную.

2. Для новой переменной взвешивания ves задаются два условия: ves=49/46,7 если и1=1 и ves=51/53,3 если и1=2. Алгоритм создания новой переменной рассмотрен выше.

3. Для запуска взвешивания наблюдений выполняется команда Данные – Взвесить наблюдения. Выполняется настройка Взвесить наблюдения по… и в поле Взвешивающая переменная помещается переменная.

4. Для отключения данной операции выполняется настройка Не использовать вес (без условия по весу).

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.