Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Материально-техническое обеспечение дисциплины



Требования к аудиториям (помещениям, местам) для проведения занятий.

Стандартно оборудованные лекционные аудитории. Для проведения отдельных занятий (по заявке) – выделение компьютерного класса, а также аудитории для проведения интерактивных лекций: видеопроектор, экран настенный, др. оборудование.

Требования к специальному программному обеспечению.

При использовании электронных учебных пособий каждый обучающийся во время занятий и самостоятельной подготовки должен быть обеспечен рабочим местом в компьютерном классе с выходом в Интернет и корпоративную сеть факультета.

Требования к перечню и объему расходных материалов.

Фломастеры цветные, губки, бумага формата А4, канцелярские товары, картриджи принтеров, диски, флеш-накопители и др. в объеме, необходимом для организации и проведения занятий, по заявкам преподавателей, подаваемым в установленные сроки.

Глоссарий

1. ПРЕОБРАЗОВАНИЯ СИГНАЛОВ

1.1. Сигнал (Signal) – то, что математики обычно называют функцией. Под

сигналом можно понимать какое-то упорядоченное множество чисел, несущих

информацию о некотором процессе. Обычно описывается двумя (одномерный

сигнал), тремя (двумерный сигнал) или более (многомерный сигнал)

параметрами. Представляется в виде конечной или бесконечной совокупности

точек. Одним из параметров для всех типов сигналов является значение уровня

сигнала (его энергии) во всех точках. В качестве других параметров обычно

выступают время (одномерный сигнал), пространственные координаты

(двумерный и многомерные сигналы). Значения всех параметров могут быть

непрерывными или дискретными. Таким образом, для каждой размерности можно

различать 2L сигналов, где L- размерность сигнала. Например, в одномерном

случае существуют сигналы, непрерывные по времени и уровню, дискретные по

времени и уровню, дискретные по времени и непрерывные по уровню,

непрерывные по времени и дискретные по уровню. Преобразование

непрерывного по времени и уровню сигнала в дискретный по времени и уровню

сигнал называется аналого-цифровым преобразованием (АЦП), обратное

преобразование - ЦАП. Так как эти вопросы выходят за рамки глоссария, в

дальнейшем все сигналы считаются дискретными по времени и уровню, то есть

цифровыми.

1.2. Преобразования сигналов (Signal Transform) – понятие, вообще говоря,

очень широкое и включает в себя любую операцию, производимую над сигналом.

В рамках словаря под преобразованием мы будем понимать лишь обобщенное

преобразование Фурье (см. Преобразование Фурье). Преобразование переводит

сигнал из одной области представления в другую. Прямое преобразование

переводит сигнал из временной (пространственной) области в область

спектра, которая еще называется трансформантой. Обратное преобразование

переводит сигнал из области трансформанты во временную

(пространственную) область.

Преобразования сигналов используются для разных целей: его сжатия, анализа и

т.д. Анализ заключается в выполнении каких-нибудь действий над сигналом и

формулировке выводов на основе полученных данных.

1.3. Спектр (Spectr) – представление сигнала в виде конечной или бесконечной

суммы некоторых элементарных сигналов, умноженных на некоторые числа. В

качестве элементарных сигналов обычно выступают ортогональные функции,

такие как Фурье, Уолша, Хаара, Адамара, Хартли, вейвлеты и т.д. Поэтому

говорят о спектре Фурье, Уолша и т.д. Числа, на которые умножаются

элементарные сигналы называются спектральными коэффициентами

(коэффициентами трансформанты). Часто просто говорят о коэффициентах

Фурье, Уолша и т.д.

1.4. Базис (Basis) – совокупность векторов пространства обладающих

следующим свойством: любой вектор пространства может быть представлен

единственным образом как их линейная комбинация . Число

базисных векторов равно размерности пространства. Аналогично и

последовательность функций является базисом функционального

пространства, если любая функция из этого пространства может быть

представлена единственным образом как . Числа называются

коэффициентами разложения.

1.5. Биортогональный базис (дуальный базис). Дуальный базис

биортогонален исходному базису: . Тогда коэффициенты

разложения (находятся на этапе анализа) и

(вычисляется при синтезе).

1.6. Ортогональный базис – частный случай биортогонального базиса, когда

базисные векторы биортогональны самим себе. В этом случае дуальный базис

идентичен исходному базису.

1.7. Линейное преобразование (Linear transform) – преобразование,

удовлетворяющее условию: преобразование суммы сигналов равно сумме

преобразований каждого сигнала. Большинство рассматриваемых в ЦОС

преобразований – линейно.

1.8. Унитарное преобразование (Unitary transform)– преобразование,

сохраняющее норму сигнала. Вещественное унитарное преобразование

называется ортогональным. Его базисные функции ортогональны между собой.

Важным свойством ортогонального преобразования является простая формула

вычисления обратного преобразования. Все упомянутые выше преобразования

являются унитарными.

1.9. Преобразование Фурье – (Fourier transform).

- непрерывное.

- дискретное.

1.10. Оконное (Short-Time) преобразование Фурье (STFT) - (ОПФ) -

определяется как преобразование Фурье сигнала, умноженного на некоторую

взвешивающую функцию (окно). Так как окно локализовано по времени, ОПФ

применяется для получения частотно-временного представления сигнала.

В настоящее время предложено большое число

различных окон: прямоугольное, треугольное, Ханна, Хэмминга и др. Простейшим

из них является прямоугольное, соответствующее случаю умножения сигнала на

константу. Так как преобразованием Фурье прямоугольника служит

осциллирующая sinc-функция, то применять такое окно не рекомендуется.

1.11 Преобразование Габора – оконное преобразование Фурье с окном .

1.12. Преобразование Карунена-Лоэва (ПКЛ) – базисные функции есть

собственные векторы ковариационной матрицы входного сигнала. Является

оптимальным по критерию достижения декорреляции входного сигнала. Энергия

входного сигнала максимально перераспределяется в коэффициентах ПКЛ.

Гарантируется, что процентное содержание энергии входного сигнала в данном

количестве наибольших коэффициентов будет не меньше, чем в том же числе

коэффициентов любого другого преобразования. Вычислительно трудоемко, кроме того, для вычисления обратного преобразования декодеру надо

передавать базисные функции, найденные кодером. Поэтому, на практике не

применяется. Все остальные преобразования часто сравниваются с ПКЛ.

1.13. Дискретное преобразование Хаара (Haar transform) – разложение

сигналов по ортонормальному базису вейвлетов Хаара.

1.14. Дискретное косинусное преобразование - ДКП (Discrete cosine

transform - DCT). Существует четыре основных типа ДКП: Определяется и дискретное синусное преобразование (косинусы заменяются на синусы). Оба

преобразования являются ортогональными.

1.15. Перекрывающееся ортогональное преобразование (ПОП) (Lapped

Orthogonal Transform - LOT). При ПОП почти отсутствуют эффекты блочности, присущие ДКП.

1.16. Обобщенное перекрывающееся ортогональное преобразование

(GenLOT) – результат ПОП умножается на дополнительные матрицы. И ДКП, и

ПОП являются частными случаями этого преобразования.

1.17. Преобразование Хартли (Hartley) – одно альтернатив ДПФ, использует

вещественные функции. Одно время рассматривалось как панацея ЦОС, но

потом оказалось в тени вейвлет-преобразования.

1.18. Свертка (Convolution). Сверткой двух векторов называется вектор,

n -й элемент которого равен .

ФИЛЬТРЫ

Фильтр (Filter) – линейная стационарная система, то есть свойства фильтра не

зависят от времени. Независимость свойств фильтра от времени означает, что

задержка входа приводит к такой же задержке выхода. К основным

характеристикам фильтров относятся импульсная характеристика ,

передаточная характеристика , частотная характеристика, порядок фильтра.

2.1. Каузальный (Causal) фильтр - реакция фильтра не может предшествовать приложенному воздействию. Система каузальна, если выходной сигнал зависит от входного сигнала только в моменты времени до момента наблюдения.

2.2. Стабильный фильтр (физически реализуемый) – сумма коэффициентов

импульсной характеристики небесконечна. У каузального и стабильного фильтра все нули передаточной функции находятся внутри единичного круга.

2.3. M -полосный фильтр (фильтр Найквиста) - один из наиболее часто

использующихся типов фильтров. Находит применение при обработке сигналов, в

связи, в многоскоростных системах, при построении сигма-дельта АЦП, фильтров

децимации и интерполяции.

2.4. Всепропускающий (Allpass) фильтр – фильтр, частотная характеристика

которого вещественна, а ее модуль равен 1.

2.5. Фильтр Баттерворта (максимально плоский фильтр) – в полосе

пропускания практически нет колебаний. Это является преимуществом для

многих приложений, где требуется постоянство коэффициента ослабления

фильтра для всех частот полосы пропускания. Недостатком такого фильтра

является невысокая крутизна полосы перехода.

2.6. Дополнительные по мощности (Power Complementary) фильтры - Примерами могут служить фильтры параунитарного банка фильтров.

2.7. Квадратурно-зеркальный фильтр – КЗФ (Quadrature Mirror Filter - QMF) – пара фильтров ВЧ и НЧ характеристики которых симметричны относительно средней частоты. Эта частота называется квадратурной, отсюда и название фильтров. КЗФ могут быть как с КИХ, так и с БИХ. Банк фильтров КЗФ может быть М-полосным.

БАНКИ ФИЛЬТРОВ

Банк фильтров (Filter Bank) – совокупность фильтров и следующих за ними

дециматоров или следующих перед ними интерполяторов. Под дециматором

понимается устройство, осуществляющее децимацию (прореживание) сигнала.

Интерполятор выполняет интерполяцию сигнала.

Банки фильтров бывают равномерные и неравномерные, ортогональные,

биортогональные, двухканальные и многоканальные и т.д. Каждый фильтр банка

фильтров образует канал. Поэтому говорят об M -канальном банке фильтров.

Сигнал в канале назыается субполосой. Отсюда название субполосная

фильтрация (субполосное кодирование).

В случае если число каналов равно коэффициенту децимации (интерполяции)

говорят о максимально (критически) децимированном банке фильтров. Быстрый

алгоритм вычисления вейвлет-преобразования строится именно на основе таких

банков фильтров.

Равномерный банк фильтров – децимация в каждом канале одинаковая. В

противном случае – неравномерный банк фильтров. Частный случай

неравномерного банка фильтров - древовидный банк фильтров.

3.1. Децимация (прореживание) (Decimation) – операция, заключающаяся в

выбрасывании отсчетов, чей порядковый номер кратен определенному числу.

Например, при децимации в два раза выбрасывается каждый второй отсчет, при

прореживании в три раза – каждый третий и т.д.

Спектр выходного сигнала при операции децимации содержит M копий «расширенного» в M раз спектра входного сигнала. Если сигнал не ограничен полосой частот, то происходит наложение спектров копий, то есть элайзинг. Поэтому в банке

фильтров перед децимацией выполняется НЧ фильтрация.

Совокупность фильтра и дециматора называется фильтром-дециматором.

3.2. Интерполяция (Interpolation) – операция, заключающаяся во

встраивании между отсчетами, чей порядковый номер кратен определенному

числу, некоторой константы (обычно нуля).

3.3. Банк фильтров анализа (Analysis Filter Bank).

3.4. Банк фильтров синтеза (Synthesis Filter Bank) :

3.5. Система анализа-синтеза (А-С) – совокупность банка фильтров анализа и

банка фильтров синтеза. Сигнал вначале декомпозируется на субполосы, в

каждой из них выполняется некоторая его обработка и, затем, выполняется

синтез сигнала (реконструкция). Надо отметить, что иногда нужен обратный

порядок операций: сначала синтез, потом анализ. Такая последовательность

действий встречается при использовании банков фильтров в связи. При этом НЧ

сигналы от разных источников интерполируются, фильтруются, объединяются и

передаются по каналу связи. На приеме групповой сигнал подается на схему

анализа для выделения сигналов отдельных абонентов. Такая схема, называется трансмультиплексором.

3.6. Lazy («ленивый») банк фильтров – система А-С без фильтров. Применяется при доказательстве теорем в банках фильтров.

3.7. Элайзинг (Aliasing) – наложение спектра, то есть два сигнала накладываются один на другой.

3.8. Устранение элайзинга (Alias Cancellation). Выходной будет свободен от элайзинговой составляющей.

4. ВЕЙВЛЕТЫ И ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ.

Вейвлеты - это математические функции, обладающие некоторыми свойствами.

В научном сообществе до сих пор не решен вопрос, какие функции относить к

вейвлетам. В узком смысле это семейство функций, получающихся путем

масштабирования и сдвигов одной, материнской функции. Именно за счет

изменения масштабов вейвлеты способны выявить особенности сигнала на

разных шкалах, а за счет сдвигов они способны пронализировать сигнал во всех

точках. В широком смысле вейвлеты - это функции, обладающие хорошей

частотно-временной локализацией, чье среднее значение равно нулю. При этом

они могут вовсе не иметь функции-прототипа (например, вейвлеты второго

поколения, названные так В.Свелденсом).

В математических кругах вейвлеты назывались одно время всплесками, но сейчас

этот термин встречается редко.

В приложениях чаще всего используют дискретные вейвлеты, так как

непрерывные вейвлеты не образуют ортонормированного базиса и бесконечно

протяжены (имеют экспоненциальный спад). С другой стороны, применение

непрерывного вейвлет-анализа позволяет лучше визуализовать результаты

анализа (получить более «красивые картинки») и, возможно, выявить какие-то

скрытые от других видов анализа свойства сигнала. Хотя я бы лично

рекомендовал использовать для анализа сигналов частотно-временные

разложения Вигнера и им подобные - там, где скорость анализа не имеет

первостепенной важности.

Рассмотрим основные термины, использующиеся в этой области. При этом надо

учесть, что если англоязычные термины являются устоявшимися, то этого нельзя

сказать о русских терминах. Даже перевод и издание «библии вейвлетов» - книги

И.Добеши «Десять лекций по вейвлетам» - не исправил до конца положения. Так,

по мнению одного из авторитетов в этой области - Л.Левковича-Маслюка -

перевод терминологии (в редакции проф. А.Петухова) выполнен неудачно. Что ж,

сколько людей - столько мнений.

4.1. Непрерывное (Continuos) вейвлет-преобразование (CWT). Под CWT функции понимается разложение по всем возможным сдвигам и сжатиям некоторой функции (порождающего вейвлета).

4.2. Вейвлет-ряды (Ортогональное дискретное (диадное) вейвлет-

преобразование). В этом случае рассматриваются не все сдвиги и растяжения

базисной функции, но только взятые на некоторой дискретной сетке (обычно

логарифмической). Заметьте, что если сигнал остается непрерывным, то называть

это преобразование дискретным неверно и приводит к путанице. Иногда его

называют диадным. Мне кажется (и не только мне), что лучше называть это

преобразование рядами вейвлетов непрерывного времени (CTWS) по аналогии с

рядами Фурье.

Если же сигнал - дискретный, то аналогичное преобразование правильно

называть дискретным вейвлет-преобразованием. Формулами вычисления прямого

ДВП является, по сути, масштабирующее уравнение (см. ниже) для вейвлет-

функции и для масштабирующей функции. Обратное ДВП всегда существует.

4.3. Кратномасштабный (многомасштабный) анализ (КМА) - Multiresolution

Analysis (MRA) - математическая конструкция, схема представления сигналов. Эта

конструкция позволяет «с другой стороны» зайти к построению вейвлет-рядов и

заключается в представлении пространства в виде бесконечной последовательности вложенных подпространств, являющихся отмасштабированными версиями друг друга и связанных определенными свойствами. Различают ортогональный и биортогональный КМА. Значение КМА заключается также и в том, что при его помощи мы можем дать более точные определения масштабирующей и вейвлет функциям, а также найти связь между ними.

4.4. Избыточное (redundancy) и безизбыточное преобразования.

Преобразование считается безизбыточным, если в коэффициентах содержится

ровно столько информации, чтобы можно было совершить обратное

преобразование. При анализе сигнала этой информации нам может показаться

мало, а обратное преобразование и не потребоваться. В этом случае прибегают к

избыточному преобразованию. Например, в случае вейвлет-фреймов (см.ниже)

число коэффициентов на каждом уровне может равняться числу отсчетов в

исходном сигнале, а число уровней быть весьма значительным (например, 64,

128).

4.5. Компактный носитель масштабирующей функции или вейвлета. Носитель

- часть области определения функции, где она не равна нулю. Свойство

компактности функций означает, что соответствующие им фильтры будут

фильтрами с конечной импульсной характеристикой, то есть иметь конечное

число коэффициентов.

4.6. Быстрое вейвлет-преобразование (Fast Wavelet Transform) -

пирамида Малла (Mallat). Входной сигнал подается на пару фильтров-

дециматоров. Выход ВЧ фильтра-дециматора считается коэффициентами, а выход

НЧ фильтра поступает на точно такую же схему (то есть в алгоритме выполняется

итерация по НЧ каналу). Сложность - не более 2LN, где L - длина фильтра, N -

длина сигнала. В самом деле, на первом уровне сложность выполнения

фильтрации LN, на втором - LN/2 и т.д.; сумма последовательности 1+1/2+1/4+...

сходится к 2.

4.7. Маска (Mask) - в литературе по аппроксимации так называется вектор, в

ЦОС называющийся вектором коэффициентов фильтра.

4.8. Масштабограмма (Scalogram) - квадрат амплитуды коэффициентов

непрерывного вейвлет-преобразования. Изображается обычно на плоскости. По

оси абсцисс откладывается, например, время, а по оси ординат - масштабы, на

которых сигнал анализировался. Масштабограмма аналогична спектрограмме,

построенной при спектральном анализе с постоянной относительной полосой

(constant-Q). Под спекттрограммой понимается квадрат амплитуды

коэффициентов оконного преобразования Фурье.

4.9. Гладкость (Smoothness) - параметр, ограничивающий сверху число

производных функции. Различные вейвлет-фильтры обладают различной

гладкостью (то есть, конечно, гладкостью обладают функции, получаемые в

пределе при бесконечном числе итераций пирамиды Малла) Например, считается

что сигнал изображения имеет гладкость 1,5-2. Поэтому, для его анализа, сжатия

можно применять вейвлет-фильтры соответствующей или большей гладкости. Как

правило, чем больше коэффициентов у вейвлет-фильтра, тем больше гладкость

соответствующей ему функции.

4.10. Симметрия (антисимметрия) базисных функций - симметрия означает,

что если перенести центр функции в начало координат, то функция будет четной.

Антисимметрия означает, что функция после переноса будет нечетной.

4.11. Принцип неопределенности (Uncertainty Principle) Гейзенберга - в

рамках рассматриваемой темы означает, что невозможно одновременно

произвольно точно зафиксировать частоту сигнала и время ее возникновения. То

и другое фиксируется с ошибкой, то есть истинное значение параметров

находится внутри некоторого окна. Если считать это окно прямоугольным, то его

площадь будет равна произведению частоты и времени. Площадь окна величина

постоянная. Именно поэтому улучшению разрешения по частоте соответствует

ухудшение разрешения по времени и наоборот.

4.12. Вейвлет-пакеты (Wavelet Packet). Если в пирамиде Малла выполнять

разложения не только по НЧ, но и по ВЧ каналу, то в конечном счете мы получим

дерево базисов, аналогичное получаемому при выполнении быстрого

преобразования Фурье. Это множество базисов и называется вейвлет-пакетами.

Функции вейвлет-пакетов ортогональны между собой на каждом уровне, а также

и между уровнями.

4.13. Алгоритм нахождения наилучшего базиса (Best basis). Вначале

строится полное дерево вейвлет-пакетов, затем по нему ищется оптимальный в

каком-то смысле путь. Для поиска оптимального пути каждому узлу дерева

сопоставляется некая стоимость. Алгоритм стремится максимизировать

суммарную стоимость. Он обходит дерево снизу вверх и на каждом уровне

принимает решение: что выгоднее - оставить два узла-потомка или же их

4.14. Лифтинговая (Lifting) схема вычисления вейвлет-преобразования.

Альтернативный пирамиде Малла способ быстрого вычисления ВП. По некоторым

оценкам снижает вычислительную стоимость в два раза, позволяет экономить

память и конструировать вейвлеты, которые другим способом не построить

(вейвлеты второго поколения). Лифтинговая схема состоит из трех звеньев:

разбиения, предсказания и обновления.

4.15. Целочисленное (Integer) вейвлет-преобразование - применяется в

двух смыслах: 1)использование целочисленных фильтров; 2)получение целых

значений коэффициентов преобразования целочисленного сигнала. В первом

случае повышается скорость вычислений, во втором случае появляется

возможность выполнения преобразования без потерь.

4.16. Мультивейвлеты получаются за счет отказа от стационарности

характеристик фильтров. Они могут применяться для многоканальных сигналов,

причем каждый канал обрабатывается «своим» фильтром. Мультивейвлеты могут

применяться и для обычных сигналов после их полифазной декомпозиции.

Интересной особенностью мультивейвлетов является возможность строить

ортогональные симметричные базисы, что было невозможным в случае обычных

вейвлетов (кроме фильтров Хаара).

4.17. М-полосные вейвлеты. В этом случае имеется одна масштабирующая

функция и несколько вейвлет-функций на каждом уровне анализа. В пирамиде

Малла сигнал на каждом уровне пропускается через М фильтров.

4.18. Вейвлет-фрейм (Frame) - преобразование, сочетающее в себе свойства

вейвлет-рядов и непрерывного вейвлет-преобразования. Вейвлеты соседних

уровней являются сжатыми копиями друг друга (как у вейвлет-рядов), а

преобразование ведется для всех сдвигов вейвлета (как при непрерывном ВП).

СТЕГАНОГРАФИЯ

Стеганография – наука о скрытии самого факта наличия информации. В этом

ее отличие от криптографии, которая занимается скрытием содержания

информации. В связи с появлением компьютеров в последние годы получила

определенное развитие компьютерная стеганография. Особенно активно ведутся

исследования в области цифровой стеганографии, или встраивания одних данных

в другие с применением методов цифровой обработки сигналов.

5.1. Цифровая стеганография. Исследования ведутся по следующим

направлениям: скрытая передача данных, внедрение цифровых водяных знаков

(Watermarking), встраивание заголовков (Captioning), идентификационных

номеров (Fingerprinting). Несмотря на полное различие областей применения, а

также предъявляемых с их стороны требований, используемые методы

встраивания во многом идентичны.

5.2. Контейнер – сообщение, в которое внедряется скрытая информация.

Обычно представляет собой речь, изображение, видео, аудиосигнал. Различают

потоковый (формируемый в реальном времени) и фиксированный (например,

изображение) контейнеры. Контейнеры могут быть случайными, выбранными из

некоторого множества, навязанными, а также являться функцией скрытого

сообщения. Ясно, что в зависимости от типа контейнера, появляются различные

особенности встраивания скрытых сообщений.

5.3. Стего – контейнер, заполненный скрытым сообщением.

5.4. Стегосообщение – скрываемое сообщение.

5.5. Стегосистема – система, выполняющая встраивание сообщений в

контейнер, а также (как правило) их обнаружение или выделение. Состоит из

предварительного кодера, стегокодера, стегодетектора (стегодекодера).

Предварительный кодер преобразует стегосообщение к виду, удобному для

внедрения. Стегокодер осуществляет это внедрение с использованием некоторого

ключа. Стегодетектор осуществляет определение наличия стегосообщения в

сигнале. Стегодекодер выделяет это сообщение. Стегосистема считается

успешной в случае, если нарушитель никаким образом не может определить факт

наличия стегосообщения в сигнале.

СЖАТИЕ ИЗОБРАЖЕНИЙ

Сжатие изображений (Image compression) – сокращение объема их

цифрового представления. Под изображением понимается прямоугольная

матрица, элементы которой обычно принимают значения (0..28-1) (полутоновые

изображения), (0..224-1) (цветные изображения), (0,1) (бинарные изображения).

Цветные изображения могут быть в RGB-формате (по 8 бит на канал), YCH-

формате (яркостная и две цветоразностные составляющие), а также и в других

форматах. Как правило, большинство алгоритмов сжатия разрабатываются для

полутоновых изображений (256 градаций серого). Это связано с тем, что такие

алгоритмы легко обобщить на случай цветного изображения. Различают сжатие

без потерь и с потерями.

6.1. Сжатие без потерь (lossless compression) – восстановленное после

сжатия изображение полностью идентично исходному («бит в бит»). То есть при

сжатии используется только статистическая избыточность, имеющаяся в

изображении. Ее используют так называемые энтропийные кодеры (Хаффмана,

арифметический). Понятно, что таким образом большого коэффициента сжатия

достичь нельзя (обычно, коэффициент сжатия не более 1.5-2). Сжатие без потерь

находит ограниченное применение в некоторых областях, например, медицине

или астрономии. Алгоритмы сжатия JPEG, JPEG2000 имеют режимы работы без

потерь. Иногда рассматривается сжатие «почти без потерь», то есть с

незаметными для человека потерями. При этом достигаются коэффициенты

сжатия порядка (6..10).

Для сжатия изображений без потерь находит применение целочисленное

вейвлет-преобразование. Его преимуществом является то, что коэффициенты

преобразования - целые числа, поэтому после обратного преобразования можно

восстановить изображение «бит в бит». Целочисленное вейвлет-преобразование

выполняется для перераспределения энергии исходного изображения, так как в

этом случе можно построить более эффективные энтропийные кодеры

6.2. Сжатие с потерями (Lossy Compression) - восстановленное изображение

визуально мало отличается от исходного. Это различие называется искажением.

Говорят, что сжатие с потерями вносит искажение. Мерой искажения может быть

визуальное отличие двух изображений. Однако, эта характеристика плохо

описывается на языке формул. Поэтому, на практике в качестве меры искажения

используется среднеквадратическая ошибка. В среде исследователей не

прекращаются споры об адекватности этой меры, однако ничего лучшего по сей

день не придумано.

Сжатие с потерями выполняется, как правило, в три этапа: линейное

преобразование (ДКП, вейвлет), квантование, энтропийное кодирование. Целей

первого этапа несколько: перераспределение энергии между отсчетами,

декорреляция отсчетов и придание коэффициентам удобной для квантования

структуры (например, нульдерева). Квантование бывает скалярное (каждый

отсчет в отдельности)и векторное. В качестве энтропийного кодера обычно

используется арифметический (более эффективный, но и более вычислительно

сложный) или кодер Хаффмана.

6.3. Перераспределение энергии - одним из предназначений линейного

преобразования изображения при его сжатии является перераспределение

энергии. Оно заключается в том, что большая часть энергии изображения после

преобразования оказывается сосредоточенной в малой части коэффициентов

(низкочастотных). Поэтому многие коэффициенты можно «обнулить», не

передавать приемнику и, тем самым, достичь сжатия. Кроме того известно, что

квантование неравномерно распределенной случайной величины более

эффективно, чем равномерно распределенной.

6.4. Декорреляция - одним из предназначений линейного преобразования

изображения при его сжатии является декорреляция коэффициентов

преобразования. Отсчеты исходного изображения коррелированы друг с другом

(коэффициент корреляции достигает 0.95). Это означает, что любой можно

довольно точно восстановить по соседним отсчетам, то есть имеется

избыточность. Оптимальным декоррелирующим преобразованием (для

гауссовского процесса) является преобразование Карунена-Лоэва. Все остальные

преобразования только приближаются к нему.

6.5. Средняя квадратическая ошибка – основная мера искажения,

возникающего при сжатии изображений. Определяется как сумма квадратов

разностей значений пикселов исходного и восстановленного изображений.

Некоторые исследователи считают, что СКО слабо коррелировано с субъективным

восприятием искажений изображения. Однако, ничего лучшего не придумано.

Вариацией является взвешенное СКО, когда измеренное в субполосах

преобразования СКО умножатся на весовой коэффициент с учетом свойств

системы человеческого зрения.

6.6. Нульдерево – одна из наиболее эффективных структур, упорядочивающих

множество вейвлет-коэффициентов изображения для целей их сжатия.

Заключается в следующем: вейвлет-коэффициенты более НЧ областей

«отвечают» за четыре коэффициента более ВЧ областей. Тем, в свою очередь,

соответствуют 16 коэффициентов еще более ВЧ областей и т.д. Таким образом,

получаем дерево коэффициентов с вершиной в самой НЧ области. Выберем

некоторый порог и назовем меньшие этого порога (по абсолютной величине)

коэффициенты незначащими.

Начиная с самой НЧ области проверяем значимость коэффициентов относительно

текущего порога. Если коэффициент незначащий, проверяем его потомков по

дереву. Если все потомки незначащие, то на месте коэффициента ставится

признак нульдерева. Таким образом одним символом обозначаем большое

множество коэффициентов. После «обхода» всех коэффициентов порог

уменьшается в два раза, и процесс повторяется.

Сжатие на основе нульдерева была впервые предложена Льюисом и Ноулесом

(1992) и улучшено в дальнейшем Шапиро (1993) и Саидом-Перельманом (1995).

6.7. Скалярное квантование – квантование каждого отсчета в отдельности.

Под квантованием цифрового сигнала понимается процесс замены значения

отсчета из одного счетного множества значением из другого счетного множества

меньшей мощности. За счет этого достигается уменьшение числа требуемых для

кодирования отсчета бит, но возникает ошибка кодирования. Расстояния между

соседними возможными значениями квантованных отсчетов называют

интервалами квантования. Различают равномерное квантование,

логарифмическое квантование, оптимальное квантование. Оптимальные

интервалы квантования находятся с применением процедуры Ллойда-Макса

(квантователь Макса).

6.8. Векторное квантование – квантуется сразу некоторое множество отсчетов

(вектор). Если скалярное квантование одномерный процесс, то векторное -

многомерный, то есть гораздо более сложный. Построение оптимального

векторного квантователя основано также на применение алгоритма Ллойда-

Макса. Сложность кодирования и декодирования намного выше, чем при

скалярном квантовании. Поэтому, обычно применяются структурированные

методы векторного квантования (то есть кодовой книге придается структура):

древовидное, решетчатое, пирамидальное ВК.

6.9. Древовидный векторный квантователь – кодовые слова упорядочены в

виде дерева. Таким образом. сложность поиска по дереву высотой N будет NlogN

вместо N^N, как было бы при не структурированной кодовой книге. Проигрыш

заключается в неоптимальности найденных кодовых слов. Разновидностью

является усеченный древовидный векторный квантователь (PTSVQ), суть

которого заключается в следующем. Вначале строится полное дерево, затем оно

усекается (аналогично, как в алгоритме вейвлет-пакетов). Таким образом

получается адаптивный квантователь.

6.10. Решетчатый квантователь – кодовые слова книги расположены в узлах

решетки. Каких-то преимуществ по сравнению с древовидным я не знаю. По

поводу теории решеток смотрите замечательную книгу Конвэя и Слоэна.

6.11. Стандарты на сжатие изображений – сжатие бинарных изображений -

JBIG, сжатие полутоновых и цветных - JPEG, JPEG2000. В стандарте JPEG в

качестве линейного преобразования используется ДКП, в JPEG2000 - вейвлет-

преобразование. На роль стандарта де-факто для сжатия смешанных тексто-

графических изображений претендует алгоритм DjVu («дежавю»), основанный на

распознавании образов и последующем применении различных алгоритмов к

различным типам изображений.

6.12. Стандарты на сжатие видео – MPEG-2, MPEG-4 (ДКП и вейвлеты,

соответственно), рекомендация МСЭ H.263, H263+ и др. Сжатие видео состоит из

двух частей: сжатие неподвижного кадра (во многом аналогично сжатию

изображений) и межкадровое кодирование (в основном применяют что-то типа

ДИКМ).

 

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.