Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Автоматизированный перевод

ПРОЕКТ

«ИКТ-КОМПЕТЕНЦИЯ. АВТОМАТИЗИРОВАННЫЙ ПЕРЕВОД»

 

 

Подготовили: магистранты 1 курса

П. Бондарева и Н. Юдин

Проверил: зав. кафедрой, д.ф.н.,

К. Б. Свойкин

 

Саранск

Современную жизнь невозможно представить без компьютеров. XXI век—это век компьютеризации, модернизации и инновационных технологий. Сейчас информационное общество не может существовать, не используя информационно-коммуникационные технологии (ИКТ). Именно поэтому новое поколение специалистов-переводчиков должно на высоком уровне владеть ИКТ-компетенцией.

В связи с появлением и широким распространением ИКТ-технологий переводческая деятельность претерпела и продолжает претерпевать значительные изменения, что в конечном итоге радикально повышает экономическую эффективность труда переводчика и существенно экономит время.

Как правило, для формирования информационно-технологической компетенции необходимы следующие знания в области ИКТ-технологий: 1. компьютерная осведомленность; 2. ИКТ-грамотность; 3. информационная культура.

Компьютерная осведомленность—это общее знакомство с персональным компьютером (ПК) и его работой. ИКТ-грамотность—это умение работать с ПК-программами и периферией. ИКТ-грамотность--неотъемлемая характеристика современного специалиста в любой области знаний, включая переводческую деятельность. Каждый специалист должен быть уверенным пользователем ПК, свободно владеть компьютерной техникой, ориентироваться в ПК-программах.

Что касается информационной культуры, то она в современном обществе необходима как для профессионального, так и для служебного роста.

Рассмотрим пошагово этапы переводческой деятельности и те ИКТ, которые могут помочь в этом процессе:

Шаг первый: подготовка к переводу иноязычного текста;

Шаг второй: интерпретация и предредактирование иноязычного текста;

Шаг третий: появление вторичного текста, собственно перевода;

Шаг четвертый: постредактирование выполненного перевода.

Для реализации поставленной цели необходимы следующие знания информационных технологий:

1.компьютерные—поисковые системы (www.altavista.com; www.dogpile.com; www.ussc.alltheweb.com), рассылки, переводческие сайты(http://aquarius.net; www.proz.com), справочники по поиску в сети для переводчиков (www.mabercom.com), порталы, форумы и т.п.

2.программные—текстовые редакторы, электронные лингвистические словари, энциклопедии, библиотеки (http://nel.nns.ru), журналы, каталоги, глоссарии, базы данных, тезаурусы www.m-w.com; http://search.thesaurus.com;www.oed.com) и т.п.

Все вышеперечисленные информационно-справочные поиски, а также переводческий анализ иноязычного текста оказывают большое влияние на переводческую деятельность. Эффективный поиск в сети, использование всех возможностей языка запросов, работа с Интернет-словарями, программами-переводчиками, поиск дефиниций через быстрый поиск глоссариев, переводных эквивалентов через проверку различных вариантов с помощью компьютерных словарей, акронимов через специализированные сайты—эти приемы улучшают эргономику переводчика и реализуют принципы компьютеризации текстовой деятельности.

Автоматизированный перевод

Автоматизированный перевод предполагает такие формы взаимодействия:

1.Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.

2.Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё, не уложившееся в схему, отдаёт человеку.

В англоязычной терминологии также различаются термины machine translation, MT (полностью автоматический перевод) и machine-aided или machine-assisted translation (MAT) (автоматизированный); если же надо обозначить и то, и другое, пишут M(A)T.

Существуют два принципиально разных подхода к построению алгоритмов машинного перевода: основанный на правилах (rule-based) и статистический, или основанный на статистике (statistical (phrase-based)). Первый подход является традиционным и используется большинством разработчиков систем машинного перевода (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии и др.). PROMT (от PROject MT — проект машинного перевода) — российская компания, разработчик систем машинного перевода. В последние годы PROMT поставляет наряду с различными вариантами своей системы автоматического перевода и сопутствующими специализированными словарями ещё и собственные решения на основе технологии памяти переводов.

Технологии PROMT не раз удостаивались наград различных конкурсов. Так, в конкурсе, который проводится ежегодно в рамках семинара по статистическому машинному переводу под эгидой Ассоциации компьютерной лингвистики (ACL), переводчик от PROMT признан лучшим для перевода с английского языка на русский в 2013.

 

 

Принципы работы

Первоначально в основе перевода PROMT лежала технология машинного перевода, основанная на правилах (RBMT). RBMT строится на основе лингвистического описания двух естественных языков (двуязычных словарей и других баз данных, содержащих морфологическую, грамматическую и семантическую информацию), формальных грамматик и, собственно, алгоритмов перевода. Качество перевода зависит от объёмов лингвистических баз данных (словарей) и глубины описания естественных языков, то есть необходим учет максимального количества особенностей грамматической структуры.

В конце 2010 года PROMT представил Гибридную технологию перевода, совмещающую в себе подход RBMT и SMT. Суть такого совмещения в том, что вместо одного варианта перевода программа порождает множество переводов, число которых у одного предложения, в зависимости от многозначности слов, конструкций и результатов статистической обработки, может доходить до нескольких сотен. Далее вероятностная модель языка позволяет выбрать самый вероятный из предложенных вариантов.

Совмещение RBMT и SMT подходов дает преимущество от обеих технологий. Такой подход также позволяет быстро обучать переводчик.

С 2011 г. PROMT также предлагает решения на основе статистического подхода.

Основные возможности

  • Перевод слов, словосочетаний и текстов, в том числе с помощью «горячих» клавиш.
  • Перевод выделенной области экрана с графическим текстом.
  • Перевод документов разных форматов: doc(x), xls(x), ppt(x), rtf, html, xml, txt, ttx, pdf (в том числе отсканированные), jpeg, png, tiff.
  • Использование, редактирование и создание специализированных словарей и профилей перевода.
  • Подключение баз Translation Memory и глоссариев.
  • Интеграция в офисные приложения, веб-браузеры, корпоративные порталы и сайты.

Ко второму типу относится популярные переводные сервисы от Яндекс и ABBYY Lingvo.

Яндекс.Переводчик (ранее — Яндекс.Перевод) — веб-сервис компании Яндекс, предназначенный для перевода части текста или веб-страницы на другой язык.

В сервисе используется самообучаемый алгоритм статистического машинного перевода, разработанный специалистами компании. Система строит свои словари соответствий на основе анализа миллионов переведённых текстов. Текст для перевода компьютер вначале сравнивает с базой слов, затем с базой моделей языка, стараясь определить смысл выражения в контексте.

Нужно отметить, что функция перевода полученных в результатах поиска страниц (по кнопке «Перевод») появилась ещё в 2009 году и осуществлялась на основе технологий PROMT.

Кроме того, переводчик встроен в Яндекс.Браузер и автоматически предлагает перевести текст на иностранном языке.

Направление перевода определяется автоматически. Возможны перевод отдельных слов, целых текстов и отдельных интернет-страниц (по ссылке). При ручном вводе текста система сама предлагает подсказки во всплывающем окне. Есть возможность двухоконного просмотра перевода и оригинала для веб-страниц. Помимо собственно машинного перевода, доступен и полный англо-русский и русско-английский словарь. Имеется приложение для устройств на базе iOS, Windows Phone и Android. Можно прослушать произношение перевода и оригинального текста (синтезированный женский голос). Переводчик от Яндекса, подобно другим инструментам автоматического перевода, имеет свои ограничения. Этот инструмент имеет целью помочь читателю понять общий смысл содержания текста на иностранном языке, он не предоставляет точных переводов.

Особенности

  • транслитерация для арабского, армянского, греческого, грузинского, иврита, корейского, фарси, японского и китайского (пиньинь) языков;
  • голосовой ввод;
  • функция перевода текста на фотографии (применяется собственная технология оптического распознавания символов);

ABBYY Lingvo — семейство электронных словарей. Создано российской компанией ABBYY.

Многоязычная версия охватывает 15 языков — русский, украинский, английский, немецкий, французский, испанский, итальянский,турецкий, латинский, китайский, португальский, татарский, казахский,шведский, польский и финский. Также существует Европейская версия — 130 словарей на 7 языках и англо-русско-английский электронный словарь.

Принцип работы

В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена. В некоторых словарях на английском, немецком и французском большинство слов озвучены профессиональными дикторами — носителями языка.

В состав программы входит обучающий модуль Lingvo Tutor, помогающий запоминать новые слова.

Помимо существующих 150 профессиональных словарей, результата лексикографической работы сотрудников компании ABBYY и авторитетных бумажных и электронных словарей существует обширная база бесплатных пользовательских словарей для программы. Словари предварительно проверяются и находятся в общем доступе на сайте ассоциации лексикографов Lingvo.

Trados — система автоматизированного перевода, первоначально (с1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory (TM, Память переводов).

Принцип работы

Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объёма работы переводчика. Фрагменты, оставшиеся непереведёнными, передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT). Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает в случае однотипных текстов, где повторяемость словосочетаний достаточно высока, то есть в случае различного рода инструкций для пользователей, технических описаний и т. п.

Основные модули

Система Trados состоит из модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций PowerPoint, текстов в формате HTML и других метаданных, документов FrameMaker, InterLeaf и др., а также для ведения терминологических баз данных (модуль MultiTerm).

  • Translator’s Workbench — модуль работы с базами данных памяти переводов TM (создания, обслуживания, импорта, экспорта). Создание документов перевода и их редактирование производятся в отдельных модулях.
  • Панель Trados в Microsoft Word — модуль для перевода документов в Microsoft Word.
  • TagEditor — модуль для перевода документов в формате PowerPoint, Excel, HTML, XML и т. п.
  • WinAlign — модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов.
  • S-Tagger — модуль для перевода документов в формате FrameMaker и InterLeaf.
  • T-Window — модуль для перевода текста из буфера обмена.
  • MultiTerm — модуль для ведения глоссариев.
  • ExtraTerm — модуль для автоматического поиска терминологических кандидатов в тексте и создания глоссариев на их основе.

Качество перевода

Перевод связан с объектом чрезвычайной сложности — с естественным языком. К тому же перевод — это творческая деятельность, и уже хотя бы поэтому он не может быть в полной мере заменен машиной. Таким образом, машинный перевод, хотя и не смог полностью заменить собой переводчика-человека, но все же оказался очень полезен.

Современные компьютерные программы перевода достаточно совершенны, но они до сих пор не могут разрешить самую сложную задачу процесса перевода: выбор контекстуально-необходимого варианта, который в каждом тексте обусловлен многими причинами. В настоящее время результат этого вида перевода может быть использован как черновой вариант будущего текста, который будет редактировать переводчик, а также как средство, чтобы в крайней ситуации отсутствия переводчика получить общее представление о теме и содержании текста.

Качество перевода зависит от тематики и стиля исходного текста, а также грамматической, синтаксической и лексической родственности языков, между которыми производится перевод.

Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Ошибки обусловлены тем, что компьютер не может думать образами и не имеет возможности оперировать реалиями разных культур и эпох так, как это способен делать человеческих мозг. Тем не менее, для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке.

Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

В настоящее время сфера использования машинного перевода сводится к промышленному переводу. Он может помочь в рутинной переводческой работе, когда быстрота выполнения перевода важнее его качества. Например, он может оказаться кстати для специалиста, не владеющего тем или иным иностранным языком, на котором ему нужно прочитать интересующий его текст. Хотя машинный перевод, как правило, оказывается полным ошибок и неувязок, человек вполне может получить общее представление о содержании текста, что поможет ему решить, стоит ли заказывать более качественный перевод или попытаться отредактировать полученный. Таким образом, результаты машинного перевода почти всегда требуют редактирования. А то, насколько адекватными можно считать результаты перевода на компьютере, определяется не только качеством системы машинного перевода, но и качеством последующего редактирования.




©2015 studopedya.ru Все права принадлежат авторам размещенных материалов.