Основные типы машинного перевода ошибки автоматического. Основные типы систем машинного перевода

06.07.2023

Каким образом осуществляется работа программы переводчика?

В ее основе лежит алгоритм перевода - последовательность однозначно и строго определенных действий над текстом для нахождения соответствий в данной паре языков L1 - L2 при заданном направлении перевода (с одного конкретного языка на другой). Обычные словари и грамматики разных языков не применимы для машинного перевода, так как описывают значения слов и грамматические закономерности в нестрогой форме, никак не приемлемой для «машинного» использования. Следовательно, нужна формальная грамматика языка, т.е. логически непротиворечивая и явно выраженная (безо всяких подразумеваний и недомолвок). Как только начали появляться формальные описания различных областей языка - прежде всего морфологии и синтаксиса, - наметился прогресс и в разработке систем автоматического перевода. Чтобы успешно работать, система машинного перевода включает в себя, во-первых, двуязычные словари, снабженные необходимой информацией (морфологической, относящейся к формам слова, синтаксической, описывающей способы сочетания слов в предложении, и семантической, т.е. отвечающей за смысл), а во-вторых - средства грамматического анализа, в основе которых лежит какая-нибудь из формальных, т.е. строгих, грамматик. Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода.

  • 1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы, например, каким членом предложения может быть данное слово. Для машины совмещение двух этих операций - и грамматического разбора, и обращения к смыслу слов - задача трудная. Лучше сделать синтаксический анализ не зависящим от смысла слов, а словарь использовать на других этапах перевода.
  • 2. Что такое независимый синтаксический анализ, можно понять, если попытаться разобрать фразу, из которой «убраны» значения конкретных слов. Блестящим образцом фразы такого рода является придуманное академиком Л.В. Щербой предложение: Глокая куздра штетко будланула бокра и кудрячит бокрёнка. Бессмысленная фраза? Как будто да: в русском языке нет слов, из которых она состоит (кроме союза и). И все же в какой-то степени мы ее понимаем.
  • 3. То есть машина осуществляет синтаксический анализ предложения без опоры на значения составляющих его слов, с использованием информации только об их грамматических свойствах. В результате синтаксического анализа возникает синтаксическая структура, которая изображается в виде дерева зависимостей: «корень» - сказуемое, а «ветви» - синтаксические отношения его с зависимыми словами. Каждое слово предложения записывается в своей словарной форме, а при ней указываются те грамматические характеристики, которыми обладает это слово в анализируемом предложении.
  • 4. 2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, их роли в данном предложении и пр.), производимое в рамках входного языка; разрешение неоднозначности (скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); анализ и перевод слов. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие / отсутствие контекстных определителей значения.
  • 5. 3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка.
  • 6. 4. Синтез выходных словоформ и предложения в целом на выходном языке. Здесь не получится обойтись простым переводом «узлов» дерева на другой язык. Синтаксис каждого языка устроен на свой лад: то, что в русском предложении - подлежащее, в другом языке может (или должно) быть выражено дополнением, а дополнение, наоборот, должно преобразоваться в подлежащее; то, что в одном языке обозначается группой слов, переводится на другой всего одним словом и т.д. Такой переход от структуры к реальному предложению называется синтаксическим синтезом.
  • 7. В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Для решения проблемы многозначности слова используется анализ контекста. Дело в том, что каждое из нескольких значений многозначного слова в большинстве случаев реализуются в своем наборе контекстов. То есть у каждого из «конкурирующих» (при интерпретации) значений - свой набор контекстов. И именно вот эта зависимость значения от окружения позволяет слушающему понять высказывание правильно. Для правильного понимания высказывания необходимо в полной мере учитывать также правила обусловленности выбранного значения лексическим окружением (действующие при «фразеологической» интерпретации слова), правила обусловленности выбранного значения семантическим контекстом (так называемые законы семантического согласования) и правила обусловленности выбранного значения грамматическим (морфолого-синтаксическим) контекстом.
  • 8. Действующие системы машинного перевода, как правило, ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.
  • 9. В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для постредактирования.

Подходы к машинному переводу

Системы машинного перевода могут использовать метод перевода основанный на лингвистических правилах. Наиболее подходящие слова из исходного языка просто заменяются словами переводного языка.

Часто утверждается, что для успешного решения проблемы машинного перевода, необходимо решить проблему понимания текста на естественном языке.

Как правило, метод перевода основанный на правилах использует символическое представление (посредника), на основе которого создается текст на переводном языке. А если учитывать природу посредника то можно говорить об интерлингвистическом машинном переводе или трансфертном машинном переводе. Эти методы требуют очень больших словарей с морфологической, синтаксической и семантической информацией и большого набора правил.

Если у системы машинного перевода будет достаточное количество данных, то можно получить перевод хорошего качества. Основная трудность заключается в формировании этих данных. Например, большие корпуса текста необходимые для статистических методов перевода, для перевода, основанного на грамматике, оказываются недостаточными. Более того, для последних, требуется дополнительное задание грамматики.

Для перевода родственных языков (русский, украинский) может оказаться достаточной простая замена слов.

Современные системы машинного перевода делят на три большие группы:

· основанные на правилах;

· основанные на примерах;

СМП, основанные на правилах

Системы машинного перевода основанные на правилах - общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках .

Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим.

На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода. Часто, такие системы противопоставляют системам машинного перевода, которые основаны на примерах.

Принцип работы таких систем - связь структуры входного и выходного предложения. Перевод при этом получается не особенно хорошего качества. Но на простых примерах работает.

Перевод с английского на немецкий будет выглядеть как:

A girl eats an apple. Ein Madchen isst einen Apfel.

Эти системы делятся на три группы:

· системы пословного перевода;

· трансфертные системы;

· интерлингвистические;

Пословный перевод

Такие системы используются сейчас крайне редко из-за низкого качества перевода. Слова исходного текста преобразуются (как есть) в слова переводного текста. Часто такое преобразование происходит без лемматизации и морфологического анализа. Это самый простой метод машинного перевода. Он используется для перевода длинных списков слов (например, каталогов). Так же он может быть использован для составления подстрочечника для TM-систем.

Трансфертные системы

Как трансфертные системы , так и интерлингвистические, имеют одну и ту же общую идею. Для перевода необходимо иметь посредника, который в себе несет смысл переводимого выражения. В интерлингвистических системах посредник не зависит от пары языков, в то время как в трансфертных - зависит.

Трансфертные системы работают по очень простому принципу: к входному тексту применяются правила, которые ставят в соответствие структуры исходного и переводного языков. Начальный этап работы включает в себя морфологический, синтаксический (а иногда и семантический) анализ текста для создания внутреннего представление. Перевод генерируется из этого представления с использованием двуязычных словарей и грамматических правил. Иногда на основе первичного представления, которое было получено из исходного текста, строят более «абстрактное» внутренне представление. Это делается для того, чтобы акцентировать места важные для перевода, и отбросить несущественные части текста. При построении текста перевода преобразование уровней внутренних представлений происходит в обратном порядке.

При использовании этой стратегии получается достаточно высокое качество переводов, с точностью в районе 90% (хотя это сильно зависит от языковой пары). Работа любой системы трансфертного перевода состоит как минимум из пяти частей:

· морфологический анализ;

· лексический трансфер;

· структурный трансфер;

· морфологическая генерация.

Морфологический анализ. Слова исходного текста классифицируются по частям речи. Выявляются их морфологические признаки. Определяются леммы слов.

Лексические категоризации. В любом тексте некоторые слова могут иметь более чем одно значение, вызывая неоднозначность в анализе. При лексической категоризации выявляется контекст слова. Возможны различного рода пометки и уточнения.

Лексический трансфер. На основе двуязычного словаря происходит перевод лемм слов. Действие очень похоже на пословный перевод.

Структурный трансфер. Слова согласуются в предложении.

Морфологическая генерация. На основе выходных данных структурного трансфера создаются словоформы переводного текста.

Одной из основных особенностей трансфеных систем машинного перевода является этап, во время которого промежуточное представление текста на языке оригинала «передается» в промежуточное представление текста в целевом языке. Это может работать на одном из двух уровней лингвистического анализа, или сразу на обоих.

1. Поверхностный (синтаксический) трансфер. Этот уровень характеризуется передачей «синтаксических структур» между исходным и переводным языком. Подходит для языков в той же семье или того же типа, например, в романских языков, между итальянским испанским, каталонским, французским, и т.д.

2. Глубинный (семантический) трансфер. Уровень характеризуется семантическим представлением. Оно зависит от языка оригинала. Это представление может состоять из ряда структур, которые представляют значение. Перевод также обычно требует структурного трансфера. Этот уровень используется для перевода между более отдаленными языками.

Интерлингвистический машинный перевод

Интерлингвистический машинный перевод - один из классических подходов к машинному переводу. Исходный текст трансформируется в абстрактное представление, которое не зависит от языка (в отличие от трансфертного перевода). Переводной текст создается на основе этого представления. Основным преимуществом такого подхода является то, что для добавления нового языка в систему. Можно доказать математически, что в рамках этого подхода, создания каждого нового интерпретатора языка для такой системы будет удешевлять ее, по сравнению, например, с системой трансфертного перевода. Кроме того, в рамках такого подхода можно

· реализовать «пересказ текста», перефразирование исходного текста в рамках одного языка;

· относительно простая реализация перевода сильно отличающихся языков, таких как, например русский и арабский.

Однако, до сих пор не существует реализаций такого подхода, которые бы корректно работали бы хотя бы для двух языков. Многие эксперты высказывают сомнения в возможности такой реализации. Сама большая сложность для создания подобных систем заключается в проектировании межъязыкового представления. Оно должно быть одновременно абстрактным и независящим от конкретных языков, но в тоже время оно должно отражать особенности любого существующего языка. С другой стороны, в рамках искусственного интеллекта, задача выделения смысла текста на данный момент до сих пор не решена.

Впервые интерлингвистический подход был предложен в 17 веке Декартом и Лейбницем, которые предложили универсальные словари, использующие числовые коды. Другие, такие как Кейв Бек, Афанасий Кирхер и Иоганн Иоахим Бехер работали над разработкой однозначного универсального языка, основанного на принципах логики и иконографики.

В 1668 году Джон Уилкинс в трактате «Опыт о Подлинной символике и философском языке» рассказал о своем интерлингва.

В 18 и 19 веков было разработано много универсальных языков, в том числе и Эсперанто. Известно, что идея универсального языка для машинного перевода, никак не проявилась на начальных этапах развития этой технологии. Вместо нее рассматривались только пары языков. Однако, в течение 1950-х и 60-х годов, исследователи в Кембридже возглавляемые Маргарет Мастерман, в Ленинграде во главе с Николаем Андреевым и в Милане Сильвио Ceccato начали работу в этой области.

В 1970-х и 1980-x годах были сделаны определенные успехи в этой области и был построен ряд систем машинного перевода.

В этом методе перевода, межъязыковое представление можно рассматривать как способ описания анализа текста, на языке оригинала. При этом, в представлении сохраняются морфологические, синтаксические характеристики текста. Предполагается, что таким образом можно передать «смысл» при создании переводного текста.

При этом иногда используется два межъязыковых представления. Одно из них более отражает характеристики исходного языка. Другое - языка перевода. Перевод в данном случае производится в два этапа.

В некоторых случаях используются два и более представления одного уровня (одинаково близкие к обоим языкам), но разнящиеся по тематике. Это необходимо для повышения качества перевода специфических текстов.

Такой подход не нов для лингвистики. Он основан на идеи близости языков. Для улучшения качества перевода, естественный язык используется в качестве моста между двумя другими языками. Например, при переводе с украинского на английский, иногда используется русский язык.

Для использования системы интерлингвистического машинного перевода необходимы:

· словари для анализа и генерации текстов;

· описание грамматик языков;

· база знаний понятий (для создания межъязыкового представления);

· правила проекции понятий для языков и представления.

Самым сложным моментом при создании такого типа является невозможность построить базу для широких областей знаний. А те базы, которые создаются для очень специфичной тематики, обладают высокой вычислительной сложностью.

58. Рецкер Я.И. О закономерных соответствиях при переводе на родной язык // Теория и методика учебного перевода. – М., 1950. С.

59. Рецкер Я.И. Теория перевода и переводческая практика. – М., 1974

60. Семенова М.Ю. Основы перевода текста. – М., 2009

61. Стрелковский Г.М. Теория и практика военного перевода. – М., 1979

62. Тер-Минасова С. Г. Язык и межкультурная коммуникация. – М.. 2000

63. Тюленев С.В. Теория перевода. - М.: Гардарики, 2004

64. Федоров А.В. Основы общей теории перевода. – СПБ., 2002

65. Флорин С., Влахов С. Непереводимое в переводе. – М., 1980

66. Халеева И.И. Основы теории обучения пониманию иноязычной речи (подготовка переводчиков). – М., 1989

67. Хомский Н. Язык и мышление. – М., 1972

68. Чернов Г.В. Теория и практика синхронного перевода. – М., 1978

69. Чужакин А., Палажченко П.Мир перевода, или Вечный поиск взаимопони­мания. М., 1997 - 2004

70. Чуковский К.И. Высокое искусство. – М., 1968.

71. Швейцер А.Д. Теория перевода (статус, проблемы, аспекты). М., 1998

72. Швейцер А. Д. Перевод и лингвистика. – М., 1973.

73. Ширяев А. Ф. Перевод как объект комплексного научного изучения // Лингвистические проблемы перевода. – М., 1981.

74. Ширяев А.Ф. Пособие по синхронному переводу. – М., 1982.

75. Ширяев А.Ф. Теория перевода. Статус. Проблемы, аспекты. М., 1988

76. Шадрин В.И.Теория sкороs в современном переводоведении // Материалы XXVІІІ межвузовской научно-методической конференции преподавате­лей и аспирантов. Вып. 5. Актуальные проблемы теории и практики пере­вода. 15-22 марта 1999 г. СПб., 1999.

Алыс шетелде шыққан әдебиеттер:

1. Bassnett-McGuire S. Translation Studies. - Methuen, L. and N.-Y., 1980.

2. Brislin R.W.(ed). Translation. Application and Research. - N.-Y., 1976.

3. Brower R. (ed). On Translation. - Cambridge (Mass.), 1959.

5. Catford J. A Linguistic Theory of Translation. - L., 1965.

6. Coseriu E. Teoria del lenguaje у lingliistica general. Cinco estudias. - Madrid, 1973.

7. Dolet E. De la manie’re de bien traduire d’une langue en l’autre. – P., 1540

8. Delisle J. L’analyse du discourse comme methode de traduction. – Ottawa, 1984

9. Dryden J. Ovid"s Episteles // W.P.Ker (ed.) Essays of John Dryden. - Oxford, 1926.

10. Firth J.R. Linguistic Analysis and Translation // For Roman Jakobson. - The Hague, 1956.

11. Goethe J.W. Drei Stucke vom Übersetzen // H.J.Storig (Hrsg.). Das Problem des Übersetzen. - Stuttgart, 1963.

12. Gutt E.-A. Translation and Relevance. Cognition and Context. - Cambridge (Mass.), 1991.

13. Güttinger F. Zielsprache. Theorie und Technik des Übersetzens. - Zürich, 1963.

14. Halliday M.A.K. Comparison and Translation // M.A.K. Halliday, A.Mclntosh, P.Strevens. The Linguistic Sciences and Language Teaching. - L., 1964.

15. Halliday M.A.K. The comparison of languages // A.Mclntosh, M.A.K.

16. Halliday. Patterns of Language. L., 1966.

17. Holz-Mänttäri J. Transtatorisches Handeln. Theorie und Methode. - Helsinki, 1964.

18. Humboldt, W. Einleitung zu «Agamemnon» // H.J. Störig (Hrsg.). Das Problem des Übersetzens. - Stuttgart, 1963.

19. Jäger G. Translation und Translationslinguistik. - Halle (Saale), 1975.

20. Jäger G., Müller D. Kommunikative und maximale Äquivalenz von Texten

// Äquivalenz bei der Translation. - Leipzig, 1982.

21. Jäger G. Die sprachlichen Bedeutungen - das zentrale Problem bei der Translation und ihrer wissenschaftlichen Beschreibung // Bedeuting und Translation. Leipzig, 1986.

22. Jakobson R. On Linguistic Aspects of Translation // R.Brower (ed.). On Translation. - Cambridge (Mass.), 1959.

23. Kade O. Zufall und Gezetzmassigkeit in der Übersetzung. - Leipzig, 1968.

24. Kade O. Die Sprachmittling als gesellschaftliche Erscheinung und Gegenstand wissenschaftlicher Untersuchung. - Leipzig, 1980.

25. Kelletat A.F. Die Ruckschritte der Übersetzungstheorie. - Vaasa, 1986.

26. Koller W. Einfürung in die Übersetzungswissenschaft // 6. Auflage. Wiebelsheim, 2001

27. Krings H.P. Was in den Kopfen von Übersetzern vorgeht. - Tübingen, 1986.

28. Lederer, M. La traduction simultanée. Experiance et théorie. - Paris, 1981.

29. Luther M. Sendbrief vom Dolmetschen // H.J.Störig (Hrsg.). Das Problem des Übersetzens. - Stuttgart, 1963.

30. Людсканов А. Превеждат човекът и машината. - София, 1957.

31. Mounin С. Les Problèmes théoriques de la traduction. - Paris, 1963.

32. Mounin G. Teoria et storia, della traduzione. - Turin, 1965.

33. Mounin G. Linguistique et traduction. - Bruxelles, 1976.

34. Neubert A. Pragmatische Aspekte der Übersetzung // A.Neubert (Hrsg.).

Grundfragen der Übersetzungswissenschaft. - Leipzig, 1968.

35. Neubert A. Text and Translation. - Leipzig, 1985.

37. Nida E. Principles of Translation as Exemplified by Bible Translating. // R.Broper (ed.) On Translation. - Cambridge (Mass.), 1959.

38. Nida E. Toward a science of translating. - Leiden, 1964

39. Nida E., Taber C.R. The Theory and Practice of Translation. - Leiden, 1964.

40. Nida E, Reyburn W.D. Meaning Across Cultures. - N-Y., 1976.

41. Quine W. Meaning and Translation. // R.Brower (ed.) On Translation. - Cambridge (Mass.), 1959.

42. Reiss K. Möglichkeiten und Grenzen der Übersetzungskritik. - München, 1971.

43. Reiss K.. Vermeer H.J. Grundlegung einer allgermeinen Translationstheorie. Tübingen, 1984.

44. Rose M.D. (ed.). Translation Spectrum. Essays in Theory and Practice. - Albany, 1981.

45. Ross C.D. Translation and Similarity // M.D.Rose (ed.) Translation Spectrum. - Albany, 1981.

46. Savory T. The Art of Translation. - L., 1952.

47. Schleiermacher F. Methoden des Übersetzens // H.J.Störig. Das Problem des Übersetzens. - Stuttgart, 1963.

48. Seleskovich D., Lederer M. Interpreter pour traduire. - Paris., 1987.

49. Snell-Hornby M. Translation Studies. An Integrated Approach. - Amsterdam, Philadelphia, 1988.

50. Sperber D., Wilson D. Relevance: Communication and cognition. - Oxford, 1986.

51. Tirkkonen-Condit S. Textual Criteria in Translation Quality Assessment, - Jyvaskyla, 1982.

52. Toury G. In Search of a Theory of Translation. - TelAviv, 1980.

53. Tytler A.F. Essay on the principles of translation. - L., 1791.

54. Vehmas-Lehto I. Quasi-Correctness. - Helsinki, 1989.

55. Vinay J.-P., Darbelnet J. Stilistique comparée du français et de 1"anglais. - Paris, 1968.

56. Voegelin C.F. Multiple Stage Translation // IJAL. - Vol.20, No.4, 1954.

57. Wilss W. Übersetzungswissenschaft: Probleme und Methoden. - Stuttgart, 1978.

58. Wilss W. Kognition und Übersetzen: Zu Theorie und Praxis der menschlichen und der maschinellen Übersetzung. - Tüsbingen, 1988.

59. Shuttleworth M., Cowie M. Dictionary of Translation Studies. – Manchester, UK: St.Jerome Publishing, 1997. – 234 p.

Пайдаланған сөздіктер, ресми құжаттар, оқулықтар, аударылған еңбектер:

1. Аяпова Ж.М., Арынов Е.М. Іскер адамның орысша-қазақша экономикалық түсіндірме сөздігі. А., 1993

2. Егеубай А. Кісілік кітабы. – Алматы, 1998.

3. Ибатов А. Қутбтың «Хусрау уа Шірін» поэмасының сөздігі (XІV ғасыр).- Алматы, 1974.

4. Ибраева А. Заң терминдерінің қазақша-орысша және орысша-қазақша қысқаша түсіндірме сөздігі. А., 1996

5. Қазақстан Республикасының Конституциясы. А., 1995

6. Қазақстан Республикасының Конституциясының түсіндірме сөздігі. А., 1996

7. Қалиев Ғ. Тіл білімі терминдерінің түсіндірме сөздігі. А., 2005.

8. Қалиев Ғ., Болғанбаев Ә. Қазіргі қазақ тілінің лексикологиясы мен фразеологиясы. А., 2006

9. Қожахметова Х.К., т.б. Қазақша-орысша фразеологиялық сөздік. А., 1988

10. Рахматуллин Х. Банк терминдерінің орысша-қазақша қысқаша сөздігі. А., 1992

11. Рүстемов Л.З. Араб-иран кірме сөздерінің қазақша-орысша түсіндірме сөздігі. А., 1989

12. Русско-казахские пословицы и поговорки/ Сост. А.Туреханов и др. – А., 1999

13. Сапарғалиев Ғ. Заң терминдерінің түсіндірме сөздігі. А., 1995

14. Тәзкире-и-Бұғра хан - ауд.Серікбай Қосан. – Алматы: Толағай, 2007.

Пайдаланған дереккөздер:

1. Абай. Шығармаларының екі томдық толық жинағы. Екінші том. Өлеңдер мен аудармалар. Поэмалар. Қара сөздер. А., 1995

2. Алтынсарин Ыбырай . Екі томдық шығармалар жинағы. А., 1988

4. Ауэзов М. Путь Абая /Пер.А.Кима. – А., 2007. Кн.1.

5. Әуезов М. Жиырма томдық шығармалар жинағы. А., т.XІІ, 1983, т. XІX, 1985.

6. Әуезов Мұхтар. Абай жолы: Роман-эпопея. А., 1989.

7. Джамбул. Избранные произведения. А., 1981

8. Есенберлин І. Алмас қылыш (тарихи роман). А., 1971

Введение

Машинный перевод - процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

Вместо "машинный" иногда употребляется слово автоматический, что не влияет на смысл. Однако не стоит путать машинный перевод с автоматизированным, он имеет совсем другое значение - при нём программа просто помогает человеку переводить тексты.

Мысль использовать электронные вычислительные машины (ЭВМ) для перевода была высказана в 1947 году в США, сразу после появления первых ЭВМ. Первая публичная демонстрация машинного перевода состоялась в 1954 году. Несмотря на примитивность той системы, этот эксперимент получил широкий резонанс.

К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:

  • · MARK
  • · GAT

Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведённых текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.

Тем не менее, в ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление мини- и персональных компьютеров, а с ними всё более сложных словарных, поисковых систем, ориентированных на работу с естественно-языковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области. Наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

Впрочем, высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода.

1. Основная часть

Системы машинного перевода делятся на три категории:

  • -системы на основе грамматических правил (Rule-Based Machine Translation, RBMT),
  • -статистические системы (Statistical Machine Translation, SMT)
  • -гибридные системы , сочетающие преимущества тех и других (являются наиболее перспективными)

Машинный перевод на основе правил - общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках. Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим . На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода. Принцип работы таких систем - связь структуры входного и выходного предложения. перевод компьютерный машинный

RBMT системы делятся на три группы :

  • · системы пословного перевода;
  • · трансферные системы (Transfer) - преобразуют структуры входного языка в грамматические конструкции выходного языка;
  • · интерлингвистические системы (Interlingua)- промежуточный язык описания смысла.

Основным достоинством систем на основе трансфера является высокая полнота охвата текстов при приемлемом уровне качества перевода, а также низкий уровень затрат на первичную разработку и модернизацию.

Компоненты типичной RBMT:

  • · Лингвистические базы данных: - двуязычные словари; - файлы имен, транслитерации; - морфологические таблицы.
  • · Модуль перевода: - грамматические правила; - алгоритмы перевода.
  • · Преимущества RBMT систем :
    • - синтаксическая и морфологическая точность;
    • - стабильность и предсказуемость результата;
    • - возможность настройки на предметную область.
  • · Недостатки RBMT систем :
  • - трудоемкость и длительность разработки;
  • -необходимость поддерживать и актуализировать лингвистические БД;
  • -"машинный акцент" при переводе.

Статистический машинный перевод - разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста (text corpora).

Статистический машинный перевод противопоставляют системам машинного перевода, основанным на правилах, Rule-Based Machine Translation (RBMT), и на примерах, Example-Based MT (EBMT).

Первые идеи статистического машинного перевода были опубликованы Уорреном Уивером (Warren Weaver) в 1949 году. "Вторая волна" - начало 1990-х, IBM. "Третья волна" - Google, Microsoft, Language Weaver, Яндекс.

Статистические модели перевода:

  • · по словам (Word-based translation - WBT)
  • · по фразам (Phrase-based translation - PBT)
  • · по синтаксису (Syntax-based translation - SBT)
  • · по иерархическим фразам (Hierarchical phrase-based translation - HPBT)

Преимущества SMT:

  • · Быстрая настройка
  • · Легко добавлять новые направления перевода
  • · Гладкость перевода

Недостатки SMT:

  • · "Дефицит" параллельных корпусов
  • · Многочисленные грамматические ошибки
  • · Нестабильность перевода

Разработчики систем машинного перевода для улучшения качества вводят некоторые "сквозные" правила, тем самым превращая чисто статистические системы в Гибридный машинный перевод. Добавление некоторых правил, то есть создание гибридных систем, несколько улучшает качество переводов, особенно при недостаточном объёме входных данных, используемых при построении индекса машинного переводчика.

Гибридный машинный перевод - интеграция разных подходов машинного перевода из возможных вариантов МП:

  • · Rule-based machine translation (RBMT) - Машинный перевод на основе правил.
  • · Corpus-based machine translation (CBMT) - Машинный перевод на корпусах текстов.
  • · Example-based machine translation (EBMT) Машинный перевод на примерах.
  • · Statistical machine translation (SMT) - Статистический машинный перевод.

Ожидается, что с помощью гибридной архитектуры удастся объединить преимущества этих подходов.

Гибридная технология перевода предполагает использование статистических методов для построения словарных баз автоматическим путем на основе параллельных корпусов, формирования нескольких возможных переводов, как на лексическом уровне, так и на уровне синтаксической структуры предложения выходного языка, применения постредактирования в автоматическом режиме и выбор лучшего (наиболее вероятного) перевода из возможных на основе языковой модели, построенной по определенному корпусу выходного языка.

Статистический МП стремится использовать лингвистические данные, а системы с "классическим" подходом, основанном на правилах, применяют статистические методы. Добавление некоторых "сквозных" правил, то есть создание гибридных систем, несколько улучшает качество переводов, особенно при недостаточном объеме входных данных, используемых при построении индексных файлов хранения лингвистической информации машинного переводчика, базирующегося на N-граммах.

Архитектура Гибридной технологии "SMT и RBMT" [

RBMT-система дополнена двумя компонентами: модулем статистического постредактирования и модулем языковых моделей. Статистическое постредактирование позволяет сгладить RB-перевод, приближая его к естественному языку и при этом сохраняя четкую структуру синтезируемого текста. Языковые модели используются для оценки гладкости и грамматической правильности вариантов перевода, порождаемых гибридной системой.

Типичная архитектура HMT :

  • · Параллельный корпус;
  • · Обучение;
  • · Языковая модель;
  • · Данные для постредактирования;
  • · Правила синтеза;
  • · Словарь терминологии.

Преимущества гибридного перевода:

  • · Быстрая автоматическая настройку на основе Translation Memories заказчика;
  • · Терминологическая точность перевода, а также единство стиля;
  • · Получение дополнительных полезных данных - двуязычного терминологического словаря.

Заключение

Главное преимущество машинного перевода в том, что он позволяет быстро справиться с очень большими объёмами текста и поэтому иногда оказывается экономически выгоднее перевода вручную. При этом следует помнить, что качество машинного перевода всегда будет уступать человеческому. Поэтому использовать его целесообразно лишь в определённых случаях.

Многие типы материалов в принципе не предназначены для машинного перевода. Так, нельзя доверять машине тексты, где неточность перевода может поставить под угрозу здоровье человека, работоспособность сложного прибора или крупный контракт - сэкономленное время здесь не оправдывает риска. Любые документы, подразумевающие юридическую ответственность, требуют контроля человека. Машинный перевод непригоден для маркетинговых материалов, где текст фактически переосмысливается в новом культурном контексте и создается заново.

Приемлемого качества можно ожидать при переводе строго формализованных технических текстов, в то время как художественные и рекламные тексты машинному переводу не поддаются.

Прибегая к машинному переводу, важно не только чётко представлять себе желаемый результат и понимать ограничения этого метода, но и учитывать ещё один фактор. Системы МП обычно требуют сложной индивидуальной настройки и доработки, в том числе "обучения" по конкретной тематике - без этого они показывают гораздо худшие результаты. В связи с этим машинный перевод имеет смысл использовать, только если предстоит перевести огромные объёмы однотипных текстов. В этом случае будет экономически целесообразно затратить определённое время на обучение системы, затем применить машинный перевод и получить на выходе текст, пригодный для постредактирования. Если же речь идёт о нескольких десятках страниц, пытаться внедрить машинный перевод бессмысленно и попросту убыточно.

Таким образом, машинный перевод с постредактированием может оказаться действительно выгодным, если переводятся тексты подходящего типа в очень больших объёмах. Поскольку большие объёмы переводов проходят через переводческие компании, которые часто специализируются в конкретных предметных областях, внедрение достаточно эффективных, но дорогих систем машинного перевода последнего поколения экономически оправдано именно в таких компаниях: ни поставщики контента, пусть даже крупные, ни индивидуальные переводчики не смогут самостоятельно эффективно использовать машинный перевод.

Используемая литература

  • 1. http://www.logrus.ru
  • 2. http://www.moluch.ru/
  • 3. https://www.academia.edu
  • 4. http://study-english.info/

Машинный, а точнее, компьютерный перевод - это также письменный перевод, поскольку в результате мы получаем письменный текст. Однако осуществляет его не переводчик, а особая компьютерная программа. Современные компьютерные программы перевода достаточно совершенны, но они до сих пор не могут разрешить самую сложную задачу процесса перевода: выбор контекстуально необходимого варианта, который в каждом тексте обусловлен многими причинами. В настоящее время результат этого вида перевода может быть использован как черновой вариант будущего текста, который будет редактировать переводчик, а также как средство, чтобы и крайней ситуации отсутствия переводчика получить общее представление о теме и содержании текста.

Еще более сложную задачу представляет перевод устного текста с помощью компьютерных программ, так как проблема распознавания устной речи находится лишь на начальном этапе своего решения. До сих пор непреодолимым препятствием является индивидуальная окраска звучания сегмента речи - на любом языке такая речь плохо формализуется.

Предварительное редактирование синтаксической структуры может заключаться в:

· разбиении сверхдлинного предложения (более 40 слов) на несколько более коротких, добавляя при этом (если необходимо) связочные элементы;

· введении в английский текст артиклей там, где это необходимо или грамматически оправдано;

· повторении элементов при сочинительной связи словосочетаний в предложении;

· введении союзов при использовании бессоюзной связи между предложениями;

· устранении конструкций в скобках в середине именной группы или в середине предложения;

· замене окказиональных аббревиатур на полные наименования либо введении специальных символов, не допускающих их перевод;

· устранении лексических и логических эллипсисов, неформальных конструкций и метафор;

· приведении к единому виду конструкций или сложных слов, которые могут встречаться в тексте в слитном, дефисном и свободном написании.

Отредактированный вручную текст затем автоматически обрабатывается в системе МП.

25. Общая схема машинного перевода.

Во всем мире использование систем машинного перевода, несмотря на все их слабые стороны, давно стало элементом профессиональной работы переводчика, который должен уметь использовать компьютер не только как пишущую машинку. Понятие автоматизированного рабочего места переводчика, включающего комплекс резидентных словарей, тезаурусов, систем проверки орфографии, систем доступа к информации по различным сетям передачи данных должно войти в обиход специалиста_филолога.

Система машинного перевода (МП) текстов может использоваться как часть такого автоматизированного рабочего места переводчика, обеспечивая при этом получение высококачественного перевода, жестко ориентированного на конкретную предметную область, задачи пользователя и тип документации. Кроме того, такая система может помочь пользователю, не знающему иностранный язык, очень быстро и с небольшими затратами получить приблизительный (грубый) перевод текстов в интересующей его области знаний, перевод, достаточный для понимания информации, передаваемой текстом на иностранном языке.

Общие требования к практическим системам

машинного перевода (МП)

· Устойчивость работы системы . Система МП должна давать результат, который можно использовать даже в случае дефектов исходного материала и неполноты словарного обеспечения.

· Тиражируемость системы . Система должна иметь достаточно простые программные и лингвистические средства для расширения областей ее применения.

· Адаптируемость системы . Система МП должна иметь средства настройки на потребности конкретных пользователей и особенности обрабатываемых документов.

· Оптимальность временных параметров . Скорость перевода текстов должна соответствовать либо объему поступающей в единицу времени информации, либо нормам работы пользователей.

· Комфорт пользователя . Сервисные средства системы должны обеспечивать удобство работы пользователя во всех возможных в системе режимах работы.

При работе с конкретной системой машинного перевода нужно помнить, что перевод осуществляется на нескольких соподчиненных уровнях реализации системы.

К таким уровням в общем случае относятся:

· уровень автоматического предредактирования текста;

· уровень лексико-морфологического анализа;

· уровень контекстного анализа и анализа групп;

· уровень анализа функциональных сегментов;

· уровень анализа предложений;

· уровень синтеза выходного текста;

· уровень автоматического постредактирования.