Многомерное шкалирование — совокупность методов, позволяющих по заданной информации о мерах различия (близости) между объектами рассматриваемой совокупности приписывать каждому из этих объектов вектор характеризующих его количественных показателей. При этом размерность искомого координатного пространства задается заранее, а «погружение» в него анализируемых объектов производится таким образом, чтобы структура взаимных различий (близостей) между ними, измеренных с помощью приписываемых им вспомогательных координат, в среднем наименее отличалась бы от заданной в смысле того или иного функционала качества /Айвазян С. А., и др., 1989/.Процедуры многомерного шкалирования отличаются от описанных выше методов линейного и нелинейного проецирования данных в пространство меньшей размерности в основном тем, что исходной информацией для них служит только матрица различий (близостей) между исследуемыми объектами и не требуется знания значений признаков для этих объектов. Когда информация задана в виде матрицы попарных расстояний между объектами, используются методы так называемого метрического шкалирования. Если же элементы матрицы выражают порядковые отношения между объектами, то применяются методы неметрического шкалирования. Ниже охарактеризован классический подход к решению задачи метрического шкалирования.
Обычно, хотя и не обязательно, пространство предполагается евклидовым. Для этого случая справедливы следующие преобразования, которые необходимы для перехода от матрицы расстояний D =(dij) к координатам объектов в пространстве для визуального анализа x1, … , xp’.
Метод определения координат точек x1, … , xN (с точностью до ортогонального вращения) и заодно размерности пространства, в которое они отображаются, основан не на непосредственном использовании матрицы D, а на преобразовании ее в матрицу B скалярных произведений центрированных векторов
где m — вектор средних значений.
Между элементами матрицы B и расстояниями dij установлено следующее соотношение
Процедура перехода от D к B называется двойным центрированием D. Матрица B размера (N ´ N) обладает следующими свойствами:
a) Неотрицательно определена.
b) Ранг матрицы B равен размерности искомого пространства отображения.
c) Ненулевые собственные числа матрицы B, упорядоченные в порядке убывания, совпадают с соответствующими собственными числами матрицы S= XXT, где X — центрированная матрица данных (неизвестная нам). Матрица S/N есть матрица ковариаций для X.
d) Пусть ur есть r‑й собственный вектор матрицы S,соответствующийr‑му собственному числу lr. Тогда вектор значений r‑й главной компоненты будет zr = XTur.
В то же время пусть yr — r‑й собственный вектор матрицы B, соответствующий тому же самому собственному значению lr, то есть
Тогда
Из свойства 4 следует, что, решая задачу собственных чисел и собственных векторов для матрицы B и ограничиваясь ненулевыми собственными числами l1, … , lp’, получаем координатное представление точек в пространстве главных компонент, основываясь на приведенных формулах.
Элементы матрицы B могут быть представлены в виде
Очевидно, решение Z является линейной функцией X и определяется лишь с точностью до ортогонального преобразования, поскольку, применяя к матрице Z преобразование вращения, получим, что преобразованная матрица Z* столь же точно восстанавливает матрицу B, как и матрица Z. Поэтому такое шкалирование называют линейным.
Подробно с классическим подходом к многомерному шкалированию можно ознакомиться в работах /Torgerson W. S., 1952; Терехина А. Ю., 1986; Дэйвисон М., 1988/. Решение задачи шкалирования, полученное классическим линейным методом, часто используется как начальное приближение в процедурах нелинейного многомерного шкалирования, которые строятся аналогично рассмотренным выше процедурам нелинейного проецирования данных в пространство меньшей размерности. Особенности этих процедур описаны в приведенной литературе по многомерному шкалированию.