Под классификацией понимается отнесение образов к тому или иному классу. При классификации используются те или иные меры близости или сходства.
В дальнейшем в качестве меры сходства используется расстояние от образа до эталона класса. В алгоритмах классификации применяется критерий минимума расстояния. Этот критерий применим как в случае единственного эталона класса, так и в случае множества эталонов.
Эталоном класса называется наиболее типичный представитель образов класса. Эталоном может быть образ из выборки, представляющей данный класс, а может быть не существующий, а определенный по каким-либо правилам идеализированный образ.
Классификация для единственного эталона
Рассмотрим задачу определения алгоритма классификации образов для классов, представленных единственными эталонами. Целью будет служить получение решающей функции как можно более простой и эффективной.
Пусть имеется классов с единственными эталонами
Если имеется образ Х, который необходимо классифицировать, то евклидово расстояние (между образом и эталоном) выражается формулой
Использовать расстояние как основу для построения решающей функции несколько затруднительно в силу ее нелинейности. Сформируем линейную функцию несколько преобразовав формулу расстояния. С учетом того, что расстояние – величина положительная, вместо него можно использовать его квадрат т.е. :
В результате выполнения несложных преобразований с учетом того, что
не зависит от , т.е. это слагаемое можно опустить, получим:
.
Обозначим полученное выражение d(Х)
d(Х) = XT´Zi – 0.5´ZiT´Zi
Так как ищется минимум расстояния, то, как следует из формулы, для функции d(Х) необходимо искать максимум.
Полученная формула d(Х) - это линейная функция и может быть представлена в виде:
Образ Х будет отнесён к классу , если
где
.
В итоге уравнение решающей функции может быть записано в виде
.
Задача классификации на множестве эталонов.
Пусть теперь каждый класс представлен множеством эталонов
тогда функцию, определяющую расстояние между образом и эталоном класса, можно определить в виде:
.
Если использовать формулу для d(Х ), то решающая функция будет иметь вид