Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Сокращение матрицы сходства



Матрица сходства содержит полную информацию о структуре ассоциаций в сознании человека. Однако в связи с большим объемом этой информации непосредственный анализ матрицы, несомненно, вызовет значительные затруднения. Поэтому матрица сходства преобразуется в более простую форму представления информации, позволяющую более эффективно анализировать результаты психосемантического исследования. Дело в том, что объекты и признаки, представленные в сознании человека, определенным образом связаны между собой. Поэтому переход от анализа отдельных объектов и признаков к их независимым группам дает возможность избавиться от избыточной информации. Сокращение матрицы сходства направлено на определение минимального количества независимых в сознании испытуемого объектов и признаков, определение их субъективной группировки и классификации и получение наглядных и доступных для интерпретации результатов. Сокращение осуществляется с помощью методов многомерного статистического анализа. В зависимости от того, сокращается ли матрица сходства между объектами или между признаками, используется математический аппарат кластерного или факторного анализа.

Кластерный анализ

Кластерный анализ предназначен для объединения объектов, сходных по множеству признаков, в группы, или так называемые кластеры. Свое название кластерный анализ получил от английского слова «cluster», означающего «гроздь». Существует большое количество алгоритмов кластерного анализа, к сожалению не всегда дающих одинаковые результаты. Простая кластеризация позволяет получить множество непересекающихся классов, исключающих друг друга. Иерархическая кластеризация дает множество кластеров, включенных друг в друга в виде дерева.

Один из алгоритмов иерархического кластерного анализа заключается в последовательном попарном объединении наиболее сходных объектов. Среди матрицы расстояний NxN ищется пара наиболее близко расположенных точек. Соответствующие этим точкам объекты объединяются в кластер, причем, оба объекта, вошедшие в кластер, исключаются из дальнейшего анализа и заменяются новым. Новый объект-кластер располагается точно посередине между двумя исходными точками. Далее вычисляются координаты нового объекта и перерасчитываются расстояния между ним и остальными объектами. Таким образом, матрица расстояний сокращается на 1 строку и 1 столбец. Затем алгоритм повторяется сначала. Данная процедура повторяется до тех пор, пока не останется всего 2 кластера. Объединяться могут как точки, соответствующие отдельным объектам, так и точки, представляющие кластеры. При этом не исключено, что кластер может состоять из одного единственного объекта, если он слишком отличается от всех остальных.

Результаты кластерного анализа могут быть наглядно представлены в виде дендрограммы, или дерева (Рис. 3). Каждое понятие представлено в дендрограмме пронумерованной ветвью. Последовательное соединение ветвей выражает объединение соответствующих объектов или кластеров. Дендрограмму обычно начинают анализировать «снизу», от «корней». Перемещаясь от основания дерева к вершине, можно последовательно выделять группы все более сходных объектов. Чем ближе к вершине соединяются между собой ветви, тем более сходны между собой соответствующие этим ветвям объекты.

В примере, представленном на Рис. 3, можно разделить все объекты на два, три или более кластера. При делении на два кластера один из них будет включать объекты 1 и 3, а второй - объекты 2, 5 и 4. При делении на три кластера первый из них объединит объекты 1 и 3, второй - 2 и 5, а в третий кластер войдет только объект 4.

Количество кластеров и входящих в них понятий зависит от того, какое расстояние для объединения мы выберем. Уменьшая расстояние, мы увеличиваем количество кластеров и уменьшаем количество входящих в них понятий. Количество необходимых для интерпретации кластеров может определяться, исходя из двух критериев. Во-первых, количество кластеров должно находиться в диапазоне от 5 до 9. При меньшем количестве кластеров в них может попадать слишком большое число объектов, в том числе и слишком разнородных, которые может быть трудно обобщить. Большее количество кластеров дает слишком дробную группировку, разводящую по разным кластерам на самом деле достаточно сходные объекты. Во-вторых, объекты, объединяющиеся на расстоянии менее 1 стандартного отклонения, являются достаточно близкими, и их следует считать объектами одного кластера. Разумеется, эти критерии достаточно условны и представляют собой удобные эвристические правила, полученные на основании опыта.

 

 

 

Факторный анализ

Факторный анализ предназначен для объединения сходных между собой признаков в факторы. Фактор - это группа признаков, коррелирующих между собой и не коррелирующих с другими признаками. Если представить каждый признак как вектор, задающий определенное измерение пространства, то группа взаимосвязанных между собой признаков будут выглядеть как «пучок» векторов. Фактор же можно представить как ось этого пучка векторов (Рис. 4 наглядно демонстрирует корреляцию признаков 1, 2 и 3 между собой, что позволяет объединить их в фактор F1, а также отсутствие корреляции этих признаков с признаком 4).

Проекция вектора признака на ось фактора будет нагрузкой этого признака на данный фактор, причем она тем больше, чем сильнее коррелирует с фактором данный признак (на рис. 4 признак 1 в большей степени коррелирует с фактором F1, поэтому проекция вектора V1 на ось F1 больше, чем проекция вектора V4).

 

Если множество коррелирующих признаков разделяется на несколько подмножеств, образуя несколько пучков векторов, то их можно объединить в несколько соответствующих факторов, которые объясняют определенную долю дисперсии данных. В каждый фактор будут входить показатели, имеющие максимальную абсолютную нагрузку на данный фактор.

В результате факторного анализа матрица коэффициентов корреляции между признаками преобразуется в матрицу факторных весов, или нагрузок, каждого признака на каждый из факторов (Рис. 5). Факторы упорядочены по уменьшению процента вклада в суммарную дисперсию, то есть, по количеству входящих в них признаков. Первый фактор включает наибольшее число признаков и является наиболее информативным, второй - меньшее число и т. д. В каждый фактор включается столько процентов признаков, сколько процентов дисперсии он описывает.

Число факторов зависит от количества и разнообразия субъективных признаков и определяет размерность семантического пространства. Как правило, для интерпретации результатов психосемантического исследования бывает достаточно первых двух-трех факторов, объединяющих наибольшее количество признаков. В этом случае о размерности семантического пространства косвенно можно судить по информативности первого фактора. Чем больше признаков он включает, тем меньше их в оставшихся факторах и тем меньше размерность семантического пространства.

 

Матрица коэффициентов корреляции Матрица факторных

между признаками нагрузок признаков

Рис. 5. Табличное выражение факторного анализа

 

Каждый фактор идентифицируется признаками, входящими в него с максимальными по абсолютной величине (без учета знака) факторными весами. Поскольку признаки, входящие в один фактор, коррелируют с другими признаками, входящими в этот фактор и не коррелируют с признаками, включенными в другие факторы, получаемые в результате анализа факторы соответствуют действительно независимым в сознании испытуемого субъективным признакам. Тогда факторы можно представить как прямоугольные оси координат семантического пространства. Каждому объекту в этом пространстве соответствует точка, координаты которой отражают значение факторных оценок данного объекта.

Графическое представление объектов в виде точек в пространстве двух независимых признаков называется двухмерной диаграммой рассеивания, или скатерграммой (Рис. 6).

Положение точки относительно оси фактора характеризует степень выраженности соответствующего этому фактору признака у данного объекта.

 

 

 

Рис. 6. Скатерграмма

 

 

Чем ближе между собой две точки в пространстве факторов, тем больше сходство соответствующих этим точкам объектов. В примере, представленном на Рис. 6, видно, что объекты разделяются на три группы: первая группа включает в себя объекты 3, 1, 5, 11 и 10, вторая группа объединяет объекты 7, 4, 2 и 8, в третью группу включаются объекты 6 и 9.

Таким образом, поскольку расположение точек в пространстве субъективных признаков наглядно отображает структуру представлений человека о различных объектах действительности, скатерграмма в психосемантическом исследовании представляет собой своего рода семантическую карту сознания.

 

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.