Sep. 27th, 2019

pascendi: (Default)
Писатель Роберт Ибатуллин выложил пост, который удостоился цитирования сразу от нескольких уважаемых людей в моей френд-ленте:
Машинный перевод, распознавание и синтез речи за последние лет десять улучшились радикально. А что будет ещё через десять? У каждого в телефоне будет Google Translate, способный переводить несложный диалог устно в реальном времени без потери качества, с естественного разговорного языка на такой же. Та самая коробочка-переводчик из научной фантастики. Не думаю, что это нереально оптимистичное ожидание. И если оно сбудется, то потребность изучать какой-либо язык кроме родного исчезнет.

Исчезнет и потребность изучать русский язык в России национальным меньшинствам. Конечно, его изучение не прекратится, но давление языковой среды на малые языки ослабнет. Угроза их вымирания уменьшится.

При условии, что они будут в Гугл-транслейте.


Все бы хорошо, но принцип действия Гугл-транслейта и аналогичных систем машинного перевода основан, в сущности, на поиске в огромном массиве текстов на исходном языке и на языке перевода фрагментов, которые по некоторым признакам (долго описывать, это сплошная математическая лингвистика) считаются эквивалентными.

При этом важно, что перевод тем лучше, чем больше эти самые массивы: за счет анализа статистики отбираются корректные эквиваленты.

Совершенно очевидно, что на редких и малоиспользуемых языках, в особенности на тех, на которых нет большого корпуса художественных и научно-технических текстов, невозможно иметь массивы текстов такого размера, который обеспечивает адекватность перевода.

Profile

pascendi: (Default)
pascendi

January 2022

S M T W T F S
       1
23 456 78
91011121314 15
16 171819202122
23242526 2728 29
3031     

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 11th, 2026 05:09 am
Powered by Dreamwidth Studios