Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Параметрический синтез

Билет 16 (синтезаторы речи. Описание. Примеры.)

Синтезаторы речи Text to Speech (TTS) — специальные программы, позволяющие формировать речевой сигнал (речь, голос) по печатному тексту. Первое упоминание о синтезе речи относится к X веку. В конце XVIII века ученый Христиан Кратценштейн, создал модель речевого тракта человека, способную произносить пять гласных звуков (а, э, и, о, у).
Си́нтез ре́чи — в широком смысле — восстановление формы речевого сигнала по его параметрам[1]; в узком смысле — формирование речевого сигнала по печатному тексту.

Синтезом речи — прежде всего называется все, что связано с искусственным производством человеческой речи.

Синтезатор речи — структура способная переводить текст/образы в речь, в программном обеспечении или аппаратных средствах.

Голосовой движок — непосредственно система/ядро преобразования текста/команд в речь, это также может существовать независимо от компьютера.

Первые синтезаторы речи на базе вычислительной техники появились в конце 1950-х годов. Они звучали довольно примитивно, и разобрать такую речь можно было с большим трудом. Работы над улучшением качества синтезированной речи продолжаются. Уже сегодня речь, генерируемую современными системами синтеза реча, порой не отличить от реальной человеческой речи.

Зачем нужен синтезатор речи?

Синтезатор речи может вам пригодиться во многих случаях, например:

· Во время путешествия — просто наберите любую фразу, и программа ее произнесет на нужном вам языке.

· Чтобы читать электронные книги, тексты, документы — вы занимаетесь своим делом, а программа читает вам вслух.

· Для изучения иностранных языков — отличная возможность бесплатно тренировать произношение и разговорные навыки.

Синтезатор речи "Капитан" представляет собой MS SAPI5-совместимый синтезатор речи по тексту. По умолчанию поддерживаются синтез русской и украинской речи (на основе русской фонемной базы). Голос обладает удовлетворительной разборчивостью речи, но низкой естественностью звучания (то есть речь "механическая"). Хорошая разборчивость речи и быстрая реакция делают синтезатор удобным для работы с программами экранного доступа. Дополнительно данный пакет способен работать с синтезаторами eSpeak, Newfon, а также с on-line голосами от Microsoft и Google, делая голоса этих синтезаторов доступными через интерфейс MS SAPI 5.x. Указанные синтезаторы не входят по умолчанию в инсталляционный пакет, поэтому их необходимо загружать и устанавливать отдельно. Подробнее об установке дополнительных голосов см. файл readme.htm, входящий в инсталляционный пакет. При использовании совместно с Капитаном модуля eSpeak поддерживается режим раздельного озвучивания кирилицы и латиницы, что позволяет более корректно читать тексты на иностранных языках (английском, немецком и французском).

ReadPlease — синтезатор английской речи из текста. Может использоваться для чтения текстов, буфера обмена, текстовых документов, электронных книг, и других текстовых материалов (форматы: текст, RTF, DOC). Речевой синтезатор (TTS) можно также использовать при изучении английского языка. Программа после запуска размещается в трее и управляется горячими клавишами. Может пристыковываться к различным окнам или рабочему столу. В платной версии имеется поддержка дополнительных языков, стандарта AT&T Natural Voices, дополнительных возможностей. Программа существует в двух версиях: бесплатная и платная. Имеется поддержка пользовательских и дополнительных словарей.

Синтезаторы делят на два типа: с ограниченным и неограниченным словарем. В устройствах с ограниченным словарем речь хранится в виде слов и предложений, которые выводятся в определенной последовательности при синтезе речевого сообщения. Речевые единицы, используемые в синтезаторах подобного типа, произносятся диктором заранее, а затем преобразуются в цифровую форму, что достигается с помощью различных методов кодирования, позволяющих компрессировать речевую информацию и хранить ее в памяти синтезирующего устройства. Существует несколько методов записи и компоновки речи.

Способы синтеза речи

Все способы синтеза речи можно подразделить на группы:

· параметрический синтез;

· конкатенативный, или компиляционный (компилятивный) синтез;

· синтез по правилам;

· предметно-ориентированный синтез.

Параметрический синтез

Параметрический синтез речи является конечной операцией в вокодерных системах, где речевой сигнал представляется набором небольшого числа непрерывно изменяющихся параметров. Параметрический синтез целесообразно применять в тех случаях, когда набор сообщений ограничен и изменяется не слишком часто. Достоинством такого способа является возможность записать речь для любого языка и любого диктора. Качество параметрического синтеза может быть очень высоким (в зависимости от степени сжатия информации в параметрическом представлении). Однако параметрический синтез не может применяться для произвольных, заранее не заданных сообщений.

Компиляционный синтез

Компиляционный синтез сводится к составлению сообщения из предварительно записанного словаря исходных элементов синтеза. Размер элементов синтеза не меньше слова. Очевидно, что содержание синтезируемых сообщений фиксируется объёмом словаря. Как правило, число единиц словаря не превышает нескольких сотен слов. Основная проблема в компилятивном синтезе — объёмы памяти для хранения словаря. В этой связи используются разнообразные методы сжатия/кодирования речевого сигнала. Компилятивный синтез имеет широкое практическое применение. За рубежом разнообразные устройства (от военных самолётов до бытовых устройств) оснащаются системами речевого ответа. В нашей стране системы речевого ответа до недавнего времени использовались в основном в области военной техники, сейчас они находят всё большее применение в повседневной жизни, например, в справочных службах операторов сотовой связи при получении информации о состоянии счета абонента.

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.