Ренат Бикматов, Сергей Ноженко

12 апреля в статье, опубликованной на портале правительства Казахстана, президент Нурсултан Назарбаев сообщил о скором переходе казахского алфавита на латиницу.

Развитие событий предполагается весьма стремительное: к концу 2017 года нужно подготовить все необходимое для реализации идеи, на 2018 год запланирована разработка единого стандарта нового казахского алфавита, начало подготовки специалистов на латинице, перевод всех школьных учебников, а к 2025 году необходимо переработать всю деловую документацию, газеты, журналы, книги.

Среди задач, с которыми уже столкнулись специалисты-лингвисты - планирование и подготовка процесса. Требуется провести оценку всего имеющегося на данный момент контента на кириллице и определить приоритеты. Что именно нужно переводить помимо учебников, документации, книг, газет? Каковы критерии, на основе которых будет производиться отбор того, что следует перевести в первую очередь, а что можно отложить? Как определить точные сроки для перевода того и другого?

Столь быстрые перемены влекут за собой не только многочисленные технические и лингвистические сложности, но пугающие цифры расходов бюджета (около 300 миллионов долларов). Мало того, эти средства будет не так-то просто получить и освоить, ибо участие в гостендерах из-за демпинговых расценок весьма малопривлекательно. К этому добавляются сложности, связанные с особенностями построения процессов внутри переводческой отрасли.

Важная задача на начальном этапе — оценка объема работ по всем направлениям. Он будет существенно зависеть от выбора способа перевода казахской письменности на латиницу: будет ли это просто транслитерация по жестким правилам, поддающаяся автоматизации, либо новое написание слов будет задаваться более сложным образом (в худшем случае слова и глоссарии переписываются заново, а еще хуже, если поменяются и правила грамматики, управляющие формообразованием слов вообще и падежными окончаниями в частности).

На данный момент введение латиницы не отменяет использования в Казахстане русского языка в качестве официального, и некоторое время кириллица и латиница будут применяться одновременно. Это значит, что придется ждать, пока международные органы стандартизации утвердят соответствующую кодировку, а разработчики CAT внедрят поддержку фактически нового языка: «казахский (латиница)».

Преобразование всех существующих лингвистических баз данных (памяти переводов и глоссариев) и базовых инструкций (стайлгайдов) — отдельная задача. Ведь если этого не сделать заранее, то по ходу подстановки старых переводов из ТМ можно случайно забыть о перекодировке.

За этим последует адаптация инструментов управления контентом (CMS), инструментов перевода и — самое главное — всех наработок по автоматизированному контролю качества перевода, начиная с автоматических средств проверки орфографии.

Немаловажное значение имеет и задача сортировки. Все предварительно отсортированные индексы, указатели должны быть пересортированы в соответствии с порядком букв в новом алфавите.

Ну и наконец, наличие в современном алфавите специфических букв предполагает использование большого количества диакритических знаков — подстрочных, надстрочных и внутристрочных условных обозначений. А кто будет писать программы проверки орфографии для нового языка, и насколько быстро это удастся реализовать?

Если смотреть глубже, с технической точки зрения, без подробностей о новой казахской письменности сложно судить о том, какие еще могут понадобиться процессы. При условии, что в казахском алфавите действительно будет, как сказано, 28 букв, означает ли это, что к ним в придачу появятся ещё и несамостоятельные с диакритическими знаками, или некоторым кириллическим буквам будут соответствовать сочетания нескольких латинских? В последнем случае при перекодировке текстов к простой замене одних символов на другие добавляется ещё проблема аббревиатур. Например, если прописная кириллическая буква заменяется на пару латинских, то что делать, если она входит в состав аббревиатуры? Заменять только на первую латинскую? На две прописные латинские? На прописную первую и строчную вторую? Впрочем, это ещё не самое сложное. Хуже если получится как в боснийском алфавите: транслитерация из кириллического в латинский частично делается по словарным правилам, т.е. в каждом конкретном случае некоторые сочетания букв преобразуются по-разному в зависимости от контекста.

Между прочим, самым разумным образом в плане алфавита, на наш взгляд, поступили узбеки, которые в своей новой латинице никаких дополнительных символов вводить не стали, исключив даже те, которые были в довоенное время. В результате символов у них меньше, чем в английском, плюс обратный апостроф и несколько букв, составленных из пары латинских. Благодаря этому для письма можно использовать практически любые кодировки и клавиатуры.

В связи со всеми вышеупомянутыми особенностями крайне важно как можно раньше получить всю необходимую информацию от казахстанских лингвистов, чтобы в нужные сроки произвести перенастройку всех переводческих систем.

В этой задаче пока слишком много неизвестных, но специалисты компании Logrus Global продолжают внимательно следить за развитием событий. В наших последующих публикациях мы осветим те вопросы, которые удастся прояснить.


* Первый казахский кириллический алфавит был представлен в XIX веке Ибрайем (Ыбрай) Алтынсарином. Православные миссионеры для религиозных изданий и «русско-туземных» школ разработали казахскую «миссионерскую» азбуку на кириллице с использованием специфических лигатурных и диакритизированных символов. Этот алфавит ограниченно применялся до 1917 года.
В 30-х годах XX века советскими учеными-тюркологами был разработан «Единый тюркский алфавит» (яналиф, или по-казахски Жаңаліп) на основе латиницы. С некоторыми модификациями, специфичными для казахского языка, он официально использовался с 1929 по 1940 год, после чего был заменен кириллицей.
Современный казахский кириллический алфавит используется в Казахстане и Монголии. В этом принятом в 1940 году алфавите, разработанном С. А. Аманжоловым, 42 буквы, из них 33 буквы русского алфавита и 9 специфических букв казахского языка: Ә, Ғ, Қ, Ң, Ө, Ұ (вместо последней до 1957 года применялась буква Ӯӯ), Ү, Һ, І. Первоначально казахские буквы размещались после букв русского алфавита, затем каждую из них поставили после русских букв, сходных по звучанию.
Будущий вариант алфавита максимально приближен к турецкому. В нем значительно оптимизировано количество букв: всего 28. Специалисты обещают, что любое казахское слово, любой казахский текст на данном варианте латиницы будет предельно понятным и удобочитаемым.

5 мая 2017

Узнать больше

Ваш запрос отправлен, спасибо!
Что-то пошло не так, Ваши данные не были отправлены, попробуйте позже.

Для правильного заполнения данной формы отключите, пожалуйста, на этом сайте блокировщики рекламы типа Adblock

Необходимо подтвердить согласие