История вопроса: печатные машинки
За несколько тысяч лет хитроумные китайцы успели довести количество иероглифов до 50000 с хвостиком. И хотя число нужных в повседневной жизни знаков не измеряется десятками тысяч, все равно, как ни крути, стандартный набор старой типографии — 9000 литер.
Долгое время набор осуществлялся по принципу «на каждый иероглиф — отдельный печатный элемент». Поэтому работать приходилось с машинками-монстрами вроде такой:
Печатная машинка фирмы «Шуангэ», 1947 год (принцип действия придуман японцем Киота Сугимото в 1915 году).
Основной ее элемент — банк иероглифов, находящихся на чернильной подушке. Над иероглифами закреплена механическая система: рукоятка, «лапка» для захвата и бобина с листом бумаги. Весь механизм вместе с бобиной вслед за рукояткой способен перемещаться влево, вправо, вперёд и назад за счет усилия машиниста. Чтобы набрать текст, машинист долго ищет с лупой нужный иероглиф, помещает над ним систему и нажатием на ручку приводит в действие «лапку», которая хватает иероглиф и на ходу, разворачивая, отпечатывает его на листе бумаги. При этом бобина с листом немного проворачивается, предоставляя место для следующего символа. Разумеется, процесс печати на таком агрегате выходит крайне медленным — опытный оператор мог набирать не более 11 иероглифов в минуту.
В 1946 году известный китайский филолог Линь Юйтан предложил вариант печатной машинки, построенной на совершенно новом принципе — разложении иероглифов на составные части.
Электромеханическая печатная машинка Линь Юйтана, 1946 г.
В отличие от габаритных предшественниц, новая машинка была ничуть не больше своих латинских аналогов, да и клавиш на ней было немного. Дело в том, что клавиши соответствовали не иероглифам, а их составным частям. В центре устройства находился «волшебный глаз»: когда машинист нажимал комбинацию клавиш, в «глазе» появлялся вариант иероглифа. Чтобы подтвердить выбор, нужно было нажать дополнительный функциональный ключ. При наличии всего 64 клавиш такая машинка легко могла обеспечить набор 90,000 знаков и скорость 50 знаков в минуту!
Хотя Линь Юйтан умудрился получить на свое изобретение патент в США, в массы оно так и не пошло. Неудивительно, ведь производство одного такого аппарата стоило на тот момент порядка 120,000 долларов. К тому же в день, когда была назначена презентация для компании «Ремингтон», машинка отказалась работать — даже волшебный глаз не помог. Идею благополучно отложили до лучших времен.
Зато в эру широкого распространения компьютеров идея Линь Юйтана о разложении иероглифов на составные части обрела новую жизнь. Она легла в основу структурных методов ввода китайских иероглифов, о которых мы сейчас и поговорим.
(Кстати, в 80-е годы тайваньская компания MiTAC даже разработала непосредственно на основании системы кодирования Линь Юйтана свой метод структурного ввода — Simplex.)
Структурные методы
Таких методов известно не меньше десятка, и все они основаны на графической структуре иероглифа. Китайские иероглифы — это паззлы, собираемые из одних и тех же частей (т.н. графем). Количество этих графем не так уж велико — 208, и их уже можно «запихнуть» в обычную клавиатуру. Правда, получится около 8 графем на одну клавишу, но эта проблема легко решается.
Один из самых распространенных методов структурного ввода — уби цзысин (Wubing zixing — «ввод по пяти чертам»). Как же он работает? Сразу предупреждаю: сложно.
На самом деле все китайские иероглифы делятся на четыре группы:
- Базовые 5 черт (一, 丨, 丿, 丶, 乙) и еще 25 очень часто употребляемых иероглифов (каждому из них сопоставлена клавиша).
- Иероглифы, между графемами которых есть определённое расстояние. Например, иероглиф 苗 состоит из графем 艹 и 田, между которыми есть расстояние (хотя на печати они немного «спрессовываются» и вам может показаться, что расстояния между ними нет).
- Иероглифы, графемы которых соединены друг с другом. Так, иероглиф 且 представляет собой графему月, соединённую с горизонтальной чертой; 尺 состоит из графемы 尸 и откидной черты.
- Иероглифы, графемы которых пересекаются либо накладываются друг на друга. Например, иероглиф 本 — это пересечение графем 木 и 一.
Ну вот, мы мысленно разбили иероглиф, который собираемся ввести, на графемы. Что дальше? Сначала посмотрим на раскладку уби:
На первый взгляд может показаться, что графемы расположены беспорядочно. На самом деле это не так. Клавиатура разбита на пять зон, по числу базовых черт, (на рисунке они отмечены разными цветами). Внутри каждой зоны клавиши пронумерованы — от центра клавиатуры к краям. Номер составляется из двух цифр от 1 до 5 — в зависимости о того, из каких базовых черт собирается графема.
Ну что ж, начнём с самых простых для ввода графем — заглавных графем каждой клавиши (они выделены крупным шрифтом в таблице). Каждая из них представляет собой один их 25 часто употребляемых иероглифов, о которых шла речь выше. Чтобы ввести такой иероглиф, достаточно нажать четыре раза на соответствующую клавишу. Выходит, что 金=QQQQ, 立=YYYY и т. п.
Таким образом, 毅=U+E+M+C. Для ввода иероглифов, состоящих более чем из четырёх графем, нужно ввести первые три графемы и последнюю.
Сложнее всего вводить иероглифы, состоящие из двух или трёх графем. Поскольку их очень много, то неизбежно появятся несколько иероглифов, претендующих на одну и ту же комбинацию клавиш. Чтобы их различать, разработчики придумали специальный код. Этот код состоит из двух цифр, первая — порядковый номер последней черты иероглифа, а вторая — номер группы иероглифа (вспомните четыре группы, на которые разделяются иероглифы).
К счастью, при наборе большинства часто используемых иероглифов не придётся думать о кодах, потому что иероглифы будут появляться на экране уже после первых двух или трёх нажатий. А 24 наиболее часто встречающихся знака можно и вовсе ввести одним нажатием (им поставлены в соответствие клавиши).
Недостатки структурного ввода очевидны: он сложный — выше была только дайджест-версия его описания! Чтобы освоить его, китайцы даже специальный мнемонический стишок придумали. Зато структурный метод открывает возможность слепого ввода, что повышает максимальную скорость набора до 160 символов в минуту. Поэтому профессиональные наборщики используют именно его. И не забываем: 160 иероглифов в минуту — это около 500 нажатий клавиш за ту же минуту!
Для структурного ввода чаще всего используют самую обычную клавиатуру QWERTY — ведь расположение иероглифов на ней все равно приходится учить. Но иногда можно встретить и вот такие клавиатуры с графемами на клавишах:
Правда, я за все свое время пребывания в Китае таких клавиатур не видела 🙂
Фонетические методы
Печатных машинок, использующих эти методы набора, попросту не существует — своим появлением фонетические методы обязаны исключительно компьютерам. Ведь используя фонетический метод, вы вводите не сам иероглиф, а его произношение — и система уже находит нужный иероглиф. Но вот проблема: в китайском языке столько знаков, что одному и тому же произношению могут соответствовать десятки иероглифов. Нужный иероглиф, как правило, приходится выбирать вручную из списка, что делает процесс ввода довольно медленным. На помощь приходят предиктивные системы наподобие T9.
Наиболее распространенный фонетический метод — знаменитый пиньинь (Pinyin). На его основе построена система фонетического ввода, которая входит в стандартный Asian Language Pack системы Windows (начиная с версии XP — до этого ее приходилось ставить дополнительно). Посмотрим, как она работает.
Например, мы хотим ввести слово «блоггер» — ванминь.
Набираем сначала wang (или wang3 с указанием тона, чтобы уменьшить количество вариантов). После нажатия пробела подставляется иероглиф с чтением ван. Но это не тот ван, что нам нужен. Жмем на него правой кнопкой:
Вылезает длинная строка соответствий. Мы можем, ломая глаза, искать там наш ван или просто ввести второй слог слова — min. Система умная — она сама найдет в словаре слово ванминь и автоматически выберет нужный ван и нужный минь. Банзай, мы сделали это!
Системы ввода Google Pinyin и Sogou Pinyin пошли дальше — они запоминают пользовательские предпочтения и подсказывают на основании контекста нужные слова.
Вот пример того, как Google Pinyin анализирует, казалось бы, зубодробительную последовательность
и выдает правильный вариант набора:
Я видел, как Ван Чжичжи играл в одном матче с Яо Мином (речь идет о двух китайских баскетболистах NBA). Особенно приятно, что имена написаны правильно.
На Тайване существует и альтернатива пиньинь-системе — ввод по чжуинь (Zhuyin). Используется не латинский алфавит, а слоговая азбука cо значками наподобие иероглифов. Поскольку значков в азбуке немного, их легко раскидать по клавиатуре. В Гонконге есть свой вариант романизации для местного диалекта — ютпхин (Jyutping), он тоже активно используется для фонетического ввода.
Основным недостатком систем фонетического ввода является довольно низкая скорость печати — около 50 знаков в минуту (сравните с уби цзысин с его 160 знаками в минуту). Дело в том, что ввод иероглифа по методу пиньинь происходит, в среднем, за шесть нажатий клавиш, тогда как при вводе по уби цзысин будет достаточно четырех. К тому же, слепой набор данным методом невозможен. И потом, нужно знать пиньинь/чжуинь, что далеко не всякому китайцу подходит, потому как с первого класса школы знания (если и были) успели немножко подвыветриться. Да и не всегда легко вспомнить, как читается какой-нибудь редкий иероглиф. Поэтому в Китае всё большую популярность набирает уби цзысин. Тем не менее, пиньинь выучить все равно проще, чем структурные методы. Ну а иностранцу такая система просто как бальзам на душу.
Как мы видим, для фонетического ввода нам также не потребуется какая-то специальная клавиатура — достаточно любой клавиатуры с латинской раскладкой QWERTY. Ну, например, вполне подойдет та, которая находится перед вами 🙂
Гибридные методы
Эти методы представляют собой некую комбинацию фонетических и структурных методов ввода. Простейший пример — метод иньсин (Yinxing — «звучание и форма»). Иероглиф набирается путем ввода транскрипции и указания на графический элемент. Ограниченный набор графических элементов разнесен по клавиатуре, так что запомнить их теоретически не сложно.
Так есть ли «стандартный» метод?
А вот и нет. В КНР наибольшей популярностью пользуются структурный метод уби и фонетический пиньинь. На Тайване любят фонетический метод чжуинь (поскольку многие учили в школе именно его, а не пиньинь) и морально устаревший структурный метод цанцзе (Cangjie). Он был изобретен еще в 1976 г. и сохранил с тех пор все свои недостатки: этим методом очень сложно вводить пунктуационные знаки, нужно всегда угадывать правильный способ разбивки иероглифа и помнить сложную раскладку (многие тайваньцы даже наклеивают ее от безысходности на монитор). В Гонконге цанцзе учат в школе и явно предпочитают его всем остальным методам.
Методы, основанные на распознавании
Получается, что ни один из перечисленных методов клавиатурного ввода не является идеальным. Неудивительно, что китайцы решили уцепиться за свою последнюю надежду — распознавание. Сейчас распознавание как речи, так и рукописного ввода входит в стандартный Language pack Windows 7. Предполагается, что перед использованием лучше перевести систему в «обучающийся режим» как минимум минут на 15, чтобы дать ей время привыкнуть к вашему почерку и особенностям речи.
Но методы, основанные на распознавании, так и не получили широкого распространения. Ввод с помощью клавиатуры по-прежнему считается более надежным.
Распознавание устного китайского осложняется тем, что не так велика доля людей, говорящих с идеальным произношением. Диалектные особенности вылезают то тут, то там и портят всю картину. Об иностранцах, для которых освоить четыре тона — уже подвиг, и говорить не приходится.
Рукописный ввод иероглифов представляется делом попроще, к тому же сейчас существует множество PDA, поддерживающих этот метод ввода. Но и этот метод не достиг широкого применения. Дело в том, что китайцы в большинстве своем пишут нечленораздельным курсивом и перестроиться на медленное вырисовывание каждой черты им бывает сложно. Часто проблема в том, что они просто не помнят нормальный порядок черт, потому что привыкли писать сокращенные формы! Вот и выходит, что ввод, основанный на распознавании, годится в основном для изучающих язык, чем активно пользуются онлайн-словари. Например, на сайте популярного Nciku всем желающим предлагается нарисовать нужный иероглиф с помощью мыши, а затем выбрать из предлагаемых системой вариантов:
И все-таки она существует!
Экспериментальная китайская клавиатура, бессмысленная и беспощадная.
Ведь именно так вы ее себе представляли?
Да, да, китайские клавиатуры с тысячами клавиш существуют. Правда по понятным причинам они не идут в серийное производство, оставаясь неким артефактом.
Но, согласитесь, все-таки приятно осознавать, что такая клавиатура где-то есть!
С Днем программиста!
Юля Дрейзис,
руководитель группы лексикографических описаний китайского языка
P.S. Другие мои статьи о китайском языке и китайской культуре вы можете прочитать в блоге команды Lingvo.
(В статье использованы картинки с сайтов wikipedia.org и magazeta.com)
Update: Юля Дрейзис теперь на Хабре — dalimon, просим любить и жаловать.
Китайская клавиатура — описание и фото :: SYL.ru
Китайский можно назвать самым феноменальным языком мира. Он относится к самым древним и распространенным живым языкам планеты. Из-за высокой степени сложности он был внесен в Книгу рекордов Гиннеса.
Многих интересует, что же в нем такого сложного. В принципе, ничего. Но только для гения, которому не составит особого труда запомнить 60.000-80.000 иероглифов, входящих в состав современного китайского языка. Даже у самых больших китайских умников нет таких знаний. Если же говорить о повседневном словарном запасе, он значительно меньше, и составляет примерно 3 тысячи знаков. Но для того чтобы выучить их, потребуется не один месяц.
Внешний вид китайской клавиатуры
Освоить язык гораздо проще, чем научиться пользоваться компьютером. В особенности если это китайская клавиатура. Многие наши соотечественники представляют ее в виде целого органа – грандиозного сооружения, длина которого составляет несколько метров. Кроме грандиозных размеров она еще имеет сотни и тысячи клавиш.
Нельзя не отметить тот факт, что какая-то истина в этой фантазии все-таки есть. Потому что китайская клавиатура с сотнями клавиш существует. Но такие устройства зачастую являются музейными экспонатами, некими компьютерными штуками.
На самом деле среди большинства китайцев в повседневной жизни пользуется спросом обычная китайская раскладка клавиатуры, имеющей латинский аналог QWERTY. С ее помощью и совершают набор этого несметного количества многообразных знаков-иероглифов.
История: древние печатные машинки
Хитроумные китайцы довели количество иероглифов до более чем 50 тысяч. Несмотря на то, что количество самых употребляемых знаков в повседневной жизни значительно меньше, стандартный набор типографии в прошлом включал 9 тысяч.
На протяжении достаточно длительного времени существовал принцип набора, заключающийся в следующем: каждому иероглифу – индивидуальный печатный элемент. Поэтому машинки-монстры, на которых были вынуждены работать китайцы, имели достаточно устрашающий вид. Одну из них можно увидеть на фото, размещенном выше.
В ее составе была своеобразная клавиатура на китайском языке. Основными элементами таких машинок выступали банки иероглифов, находившиеся на чернильной подушке. Над ними закреплялась механическая система, которая состояла из рукоятки, лапки для захвата и бобины с бумагой. Машинисту требовалось приложить немалые усилия для перемещения всего этого механизма с бобиной вслед за рукояткой. Его можно было передвигать влево, вправо и вперед.
Принцип работы первой печатной машинки
Для набора текста машинисту требовалось сначала отыскать с помощью лупы необходимый иероглиф, затем переместить на него всю систему. После этого следовало нажать на ручку, которая приводила в действие лапку, захватывающую и переворачивающую на ходу иероглиф. Таким образом, он отпечатывался на бумажном листе.
Во время этого процесса происходило незначительное проворачивание бобины. Так освобождалось свободное место для следующего иероглифа. Естественно, на таком агрегате нельзя было печатать очень быстро. Даже у самого опытного оператора не получалось набирать более 11 иероглифов за одну минуту.
Изобретение Линь Юйтана
В 1946 году известным китайским филологом Линь Юйтаном был предложен вариант печатной машинки с совершенно новым принципом работы – китайская клавиатура состояла из иероглифов, разложенных на составные части.
Главным отличие этой машинки от предшественниц — ее размеры. Она имела такие же габариты, как и латинские аналоги. Да и количество клавиш значительно снизилось. Главный принцип работы заключался в соответствии их составным частям иероглифов.
В центральной части машинки был размещен «волшебный глаз». После нажатия машинистом комбинации клавиш в нем появлялся вариант иероглифа. Для его выбора требовалось нажатие дополнительного функционального ключа. Это печатающие устройство имело всего 64 клавиши. Но оно обеспечивало набор 90 тысяч знаков со скоростью 50 в минуту.
Новая жизнь старого изобретения
Юйтану удалось запатентовать свое изобретение в США, но оно не получило массового использования. Это объясняется высокой стоимостью производства такого аппарата. На то время его цена составляла примерно 120 тысяч долларов. Да и в день презентации новое оборудование просто отказалось работать. Поэтому идея была отложена до лучших времен.
Но когда наступила эра распространения компьютеров, идее Линь Юйтана было суждено обрести новую жизнь. Она является основой структурных методов, которые используются для ввода китайских иероглифов.
Современные китайские клавиатуры
В наше время большинство китайцев пользуются стандартной, привычной для нас QWERTY-клавиатурой. В составе иероглифов имеются одни и те же черты – графемы. Всего их в письме 250 штук. Поэтому они уже смогут поместиться на стандартной клавиатуре. Только китайская клавиатура (фото размещено ниже) на одной клавише имеет не один символ, а 7-8 графем. Поэтому для работы с ней требуется значительно больше знаний и сил. Но главная сложность заключается не в том, как выглядит китайская клавиатура.
Самая главная проблема – это набор текста на ней. Существует два самых распространенных метода ввода иероглифов: фонетический и по чертам.
Иероглифы разделили на 4 основные группы с 5 базовыми чертами и 25 наиболее часто употребляемых. Для того чтобы вводить иероглифы по чертам, китайцы пользуются стандартной, привычной для нас клавиатурой. В современном мире имеется даже специальная китайская клавиатура (фото свидетельствует о том, что на ее клавишах нанесены графемы).
Но знание сочетаний клавиш, которые надо использовать при написании каждого иероглифа, все равно необходимо. Нажатием одной клавиши можно выполнить введение 24 наиболее употребляемых иероглифов. Наиболее встречаемые появятся на экране сразу же после 2 или 3 правильных нажатий.
Особенности расположения графем
На первый взгляд кажется, что такая китайская клавиатура для компьютера имеет беспорядочное расположение графем. Но на самом деле ему свойственен определенный расчет. Все клавиши разбили на 5 зон в соответствии с количеством базовых черт. Каждая клавиша в определенной зоне имеет свой номер, который расположен от центра к краю. Заглавный знак каждой клавиши – один из 25 самых часто употребляемых иероглифов.
Для написания заглавного иероглифа необходимо нажать соответственную клавишу 4 раза. Если в его составе имеется 4 графемы, поочередно нажимаются 3 определенные клавиши, а четвертая обозначается как последняя.
Затем процесс усложняется еще больше, так как есть иероглифы, которые состоят из 2 или 3 графем. Этим обусловлена путаница из-за наличия нескольких графем с одной и той же комбинацией клавиш. Для их различения разработчики, которыми была изобретена китайская виртуальная клавиатура, ввели специальный двухзначный код. Первая его цифра – это порядковый номер последней черты иероглифа, а вторая – группа иероглифа.
Описанный метод не является совершенным и имеет много недостатков. Одним и самым главным из них считается сложность. Но, невзирая на это, при его использовании можно увеличить количество введенных за минуту иероглифов до 160. Для этого необходимо нажать клавиши более 500 раз.
Фонетический метод ввода
В мире нет печатных машинок, которые используют этот метод. Он появился только после изобретения компьютеров. Для написания иероглифа необходимо ввести его произношение, а не символ. После этого «умная» китайская экранная клавиатура выдаст вам правильный вариант. Этот способ чем-то напоминает функцию Т9. Но так как китайский язык состоит из большого количества иероглифов, имеющих одинаковое произношение, необходимый знак надо искать самостоятельно.
Данный метод ввода по уровню своей сложности ничем не уступает первому. Хотя для него не надо иметь какую-то специальную клавиатуру – подойдет любая имеющая латинскую раскладку QWERTY.
Китайцы в своем прогрессе никогда не останавливаются. Сейчас есть китайская клавиатура онлайн, набирающая текст автоматически, когда человек произносит слова в специальный микрофон. Таким образом, был полностью автоматизирован человеческий труд и сэкономлено очень много времени. Среди основных функций этой клавиатуры имеется автоматическое исправление грамматических и пунктуационных ошибок в тексте. Для этого достаточно нажать всего лишь одну виртуальную кнопку.
Зная, как выглядит китайская клавиатура для компьютера, нам остается только радоваться нашей — простой и удобной, в которой каждой букве отведена отдельная клавиша.
Конечно, нет. Китайцы тоже пользуются стандартными по размеру клавиатурами, такими же, как и у нас. Но пришли они к этом не сразу. Первые их печатные машинки были просто адскими машинами. Например, печтаная машинка «Шуангэ» середины прошлого века. Прицнип ее действия достаточно прост и основан на банке иероглифов, находящемся на чернильной подушке. Машинист должен был обладать дьявольским терпением: ему приходилось долго искать с лупой нужный иероглиф (каждому иероглифу в машине соответствовал отдельный знак), затем с помощью рукоятки привести в дейтсиве «лапу», которая «захватывает» нужный иероглиф и отпечатывает его на прикрелпленном сверху листе бумаге. После этого бобина с листом немного смещается, освобождая место на листе для следующего символа. Как вы понимате быстро печтать на такой машине не удавалось — по 10 иегролифов в минуту в лучшем случае.
Позже появились более удобные машинки, на которых клавиш было немного. Это удалось сделать за счет разложения иероглифов на составные части. Всего 64 клавиши! Устройство предполагало наличие специального «окошка», в котором появлялся тот или иной иероглиф в зависимости от нажатой машинистом клавиши. Если нужен был другой вариант в этом ряду, применялся специальный функциональный ключ, помогающий доопределить верный иероглиф. Несмотря на тот факт, что на такой машине тексты печатались гораздо быстрее, она в массы не ушла. В первую очередь, из-за своей дорговизны.
Однако структурный метод набора иероглифов (а это именно он) впоследствии стал применяться на компьютерных клавиатурах, дойдя до наших дней. Собственно, вси китайские иероглифы состоят из наборов одних и тех же графем, то есть составных частей. Всего 208 графем. Собственно, есть 5 базовых черт (一, 丨, 丿, 丶, 乙) и 25 наиболее употребляемых иероглифов. Для всех них на клавиатуре есть отдельная клавиша. Есть еще несколько констант и правил китайского языка, благодаря которым набор иегроглифов на клавиатуре становится чуть проще. В любом случае, чаще всего для набора текста китайцам приходится по несколько раз нажимать на одну и ту же клавишу или использовать комбинации. Ну а что поделать, если китацем родился.
Конечно, есть еще фонетический способ набор текста. И гибридные, сочетающий в себе фонетический и структурный методы. Но в случае с китайским все способы сложны и требуют усидчивости и внимания. Если хотите пройти испытания, после которых вам уже всё будет по плечу, — начните изучать этот удивительный язык.
——————
Ну и чтобы не потеряться в море информации и прочитать вовремя новый материал, добавляйтесь в друзья — задружить в Живом Журнале
——————
Предлагаю также добавляться в друзья и подписываться на мои аккаунты в социальных медиа:
Моя страница ВКонтакте
Моя страница на Facebook
Мой twitter
Мой instagram
[Немного о записках о жизни]Данный журнал является личным дневником, содержащим частные мнения автора. В соответствии со статьёй 29 Конституции РФ, каждый человек может иметь собственную точку зрения относительно его текстового, графического, аудио и видео наполнения , равно как и высказывать её в любом формате. Журнал не имеет лицензии Министерства культуры и массовых коммуникаций РФ и не является СМИ, а, следовательно, автор не гарантирует предоставления достоверной, непредвзятой и осмысленной информации. Сведения, содержащиеся в этом дневнике, а так же комментарии автора этого дневника в других дневниках, не имеют никакого юридического смысла и не могут быть использованы в процессе судебного разбирательства. Автор журнала не несёт ответственности за содержание комментариев к его записям.
Понравился пост? Поделитесь с друзьями:
Вы, вероятно, представляли ее себе как целый орган — грандиозное сооружение длиной в пару метров с сотнями и тысячами клавиш. На самом деле, большинство китайцев используют обычную клавиатуру с латинской раскладкой QWERTY. Но как с помощью нее можно набрать такое несметное количество различных иероглифов? Мы попросили рассказать об этом нашу сотрудницу Юлию Дрейзис. Ее с Китаем связывают и давняя любовь, и работа.
История вопроса: печатные машинки
За несколько тысяч лет хитроумные китайцы успели довести количество иероглифов до 50000 с хвостиком. И хотя число нужных в повседневной жизни знаков не измеряется десятками тысяч, все равно, как ни крути, стандартный набор старой типографии — 9000 литер.Долгое время набор осуществлялся по принципу «на каждый иероглиф — отдельный печатный элемент». Поэтому работать приходилось с машинками-монстрами вроде такой:
Печатная машинка фирмы «Шуангэ», 1947 год (принцип действия придуман японцем Киота Сугимото в 1915 году).Основной ее элемент — банк иероглифов, находящихся на чернильной подушке. Над иероглифами закреплена механическая система: рукоятка, «лапка» для захвата и бобина с листом бумаги. Весь механизм вместе с бобиной вслед за рукояткой способен перемещаться влево, вправо, вперёд и назад за счет усилия машиниста. Чтобы набрать текст, машинист долго ищет с лупой нужный иероглиф, помещает над ним систему и нажатием на ручку приводит в действие «лапку», которая хватает иероглиф и на ходу, разворачивая, отпечатывает его на листе бумаги. При этом бобина с листом немного проворачивается, предоставляя место для следующего символа. Разумеется, процесс печати на таком агрегате выходит крайне медленным — опытный оператор мог набирать не более 11 иероглифов в минуту.
В 1946 году известный китайский филолог Линь Юйтан предложил вариант печатной машинки, построенной на совершенно новом принципе — разложении иероглифов на составные части.
Электромеханическая печатная машинка Линь Юйтана, 1946 г.
В отличие от габаритных предшественниц, новая машинка была ничуть не больше своих латинских аналогов, да и клавиш на ней было немного. Дело в том, что клавиши соответствовали не иероглифам, а их составным частям. В центре устройства находился «волшебный глаз»: когда машинист нажимал комбинацию клавиш, в «глазе» появлялся вариант иероглифа. Чтобы подтвердить выбор, нужно было нажать дополнительный функциональный ключ. При наличии всего 64 клавиш такая машинка легко могла обеспечить набор 90,000 знаков и скорость 50 знаков в минуту!
Хотя Линь Юйтан умудрился получить на свое изобретение патент в США, в массы оно так и не пошло. Неудивительно, ведь производство одного такого аппарата стоило на тот момент порядка 120,000 долларов. К тому же в день, когда была назначена презентация для компании «Ремингтон», машинка отказалась работать — даже волшебный глаз не помог. Идею благополучно отложили до лучших времен.
Зато в эру широкого распространения компьютеров идея Линь Юйтана о разложении иероглифов на составные части обрела новую жизнь. Она легла в основу структурных методов ввода китайских иероглифов, о которых мы сейчас и поговорим.
(Кстати, в 80-е годы тайваньская компания MiTAC даже разработала непосредственно на основании системы кодирования Линь Юйтана свой метод структурного ввода — Simplex.)
Структурные методы
Таких методов известно не меньше десятка, и все они основаны на графической структуре иероглифа. Китайские иероглифы — это паззлы, собираемые из одних и тех же частей (т.н. графем). Количество этих графем не так уж велико — 208, и их уже можно «запихнуть» в обычную клавиатуру. Правда, получится около 8 графем на одну клавишу, но эта проблема легко решается.
Один из самых распространенных методов структурного ввода — уби цзысин (Wubing zixing — «ввод по пяти чертам»). Как же он работает? Сразу предупреждаю: сложно.
На самом деле все китайские иероглифы делятся на четыре группы:
- Базовые 5 черт (一, 丨, 丿, 丶, 乙) и еще 25 очень часто употребляемых иероглифов (каждому из них сопоставлена клавиша).
- Иероглифы, между графемами которых есть определённое расстояние. Например, иероглиф 苗 состоит из графем 艹 и 田, между которыми есть расстояние (хотя на печати они немного «спрессовываются» и вам может показаться, что расстояния между ними нет).
- Иероглифы, графемы которых соединены друг с другом. Так, иероглиф 且 представляет собой графему月, соединённую с горизонтальной чертой; 尺 состоит из графемы 尸 и откидной черты.
- Иероглифы, графемы которых пересекаются либо накладываются друг на друга. Например, иероглиф 本 — это пересечение графем 木 и 一.
Ну вот, мы мысленно разбили иероглиф, который собираемся ввести, на графемы. Что дальше? Сначала посмотрим на раскладку уби:
На первый взгляд может показаться, что графемы расположены беспорядочно. На самом деле это не так. Клавиатура разбита на пять зон, по числу базовых черт, (на рисунке они отмечены разными цветами). Внутри каждой зоны клавиши пронумерованы — от центра клавиатуры к краям. Номер составляется из двух цифр от 1 до 5 — в зависимости о того, из каких базовых черт собирается графема.
Ну что ж, начнём с самых простых для ввода графем — заглавных графем каждой клавиши (они выделены крупным шрифтом в таблице). Каждая из них представляет собой один их 25 часто употребляемых иероглифов, о которых шла речь выше. Чтобы ввести такой иероглиф, достаточно нажать четыре раза на соответствующую клавишу. Выходит, что 金=QQQQ, 立=YYYY и т. п.
Таким образом, 毅=U+E+M+C. Для ввода иероглифов, состоящих более чем из четырёх графем, нужно ввести первые три графемы и последнюю.
Сложнее всего вводить иероглифы, состоящие из двух или трёх графем. Поскольку их очень много, то неизбежно появятся несколько иероглифов, претендующих на одну и ту же комбинацию клавиш. Чтобы их различать, разработчики придумали специальный код. Этот код состоит из двух цифр, первая — порядковый номер последней черты иероглифа, а вторая — номер группы иероглифа (вспомните четыре группы, на которые разделяются иероглифы).
К счастью, при наборе большинства часто используемых иероглифов не придётся думать о кодах, потому что иероглифы будут появляться на экране уже после первых двух или трёх нажатий. А 24 наиболее часто встречающихся знака можно и вовсе ввести одним нажатием (им поставлены в соответствие клавиши).
Недостатки структурного ввода очевидны: он сложный — выше была только дайджест-версия его описания! Чтобы освоить его, китайцы даже специальный мнемонический стишок придумали. Зато структурный метод открывает возможность слепого ввода, что повышает максимальную скорость набора до 160 символов в минуту. Поэтому профессиональные наборщики используют именно его. И не забываем: 160 иероглифов в минуту — это около 500 нажатий клавиш за ту же минуту!
Для структурного ввода чаще всего используют самую обычную клавиатуру QWERTY — ведь расположение иероглифов на ней все равно приходится учить. Но иногда можно встретить и вот такие клавиатуры с графемами на клавишах:
Правда, я за все свое время пребывания в Китае таких клавиатур не видела 🙂
Фонетические методы
Печатных машинок, использующих эти методы набора, попросту не существует — своим появлением фонетические методы обязаны исключительно компьютерам. Ведь используя фонетический метод, вы вводите не сам иероглиф, а его произношение — и система уже находит нужный иероглиф. Но вот проблема: в китайском языке столько знаков, что одному и тому же произношению могут соответствовать десятки иероглифов. Нужный иероглиф, как правило, приходится выбирать вручную из списка, что делает процесс ввода довольно медленным. На помощь приходят предиктивные системы наподобие T9.
Наиболее распространенный фонетический метод — знаменитый пиньинь (Pinyin). На его основе построена система фонетического ввода, которая входит в стандартный Asian Language Pack системы Windows (начиная с версии XP — до этого ее приходилось ставить дополнительно). Посмотрим, как она работает.
Например, мы хотим ввести слово «блоггер» — ванминь.
Набираем сначала wang (или wang3 с указанием тона, чтобы уменьшить количество вариантов). После нажатия пробела подставляется иероглиф с чтением ван. Но это не тот ван, что нам нужен. Жмем на него правой кнопкой:
Вылезает длинная строка соответствий. Мы можем, ломая глаза, искать там наш ван или просто ввести второй слог слова — min. Система умная — она сама найдет в словаре слово ванминь и автоматически выберет нужный ван и нужный минь. Банзай, мы сделали это!
Системы ввода Google Pinyin и Sogou Pinyin пошли дальше — они запоминают пользовательские предпочтения и подсказывают на основании контекста нужные слова.
Вот пример того, как Google Pinyin анализирует, казалось бы, зубодробительную последовательность
и выдает правильный вариант набора:
Я видел, как Ван Чжичжи играл в одном матче с Яо Мином (речь идет о двух китайских баскетболистах NBA). Особенно приятно, что имена написаны правильно.
На Тайване существует и альтернатива пиньинь-системе — ввод по чжуинь (Zhuyin). Используется не латинский алфавит, а слоговая азбука cо значками наподобие иероглифов. Поскольку значков в азбуке немного, их легко раскидать по клавиатуре. В Гонконге есть свой вариант романизации для местного диалекта — ютпхин (Jyutping), он тоже активно используется для фонетического ввода.
Основным недостатком систем фонетического ввода является довольно низкая скорость печати — около 50 знаков в минуту (сравните с уби цзысин с его 160 знаками в минуту). Дело в том, что ввод иероглифа по методу пиньинь происходит, в среднем, за шесть нажатий клавиш, тогда как при вводе по уби цзысин будет достаточно четырех. К тому же, слепой набор данным методом невозможен. И потом, нужно знать пиньинь/чжуинь, что далеко не всякому китайцу подходит, потому как с первого класса школы знания (если и были) успели немножко подвыветриться. Да и не всегда легко вспомнить, как читается какой-нибудь редкий иероглиф. Поэтому в Китае всё большую популярность набирает уби цзысин. Тем не менее, пиньинь выучить все равно проще, чем структурные методы. Ну а иностранцу такая система просто как бальзам на душу.
Как мы видим, для фонетического ввода нам также не потребуется какая-то специальная клавиатура — достаточно любой клавиатуры с латинской раскладкой QWERTY. Ну, например, вполне подойдет та, которая находится перед вами 🙂
Гибридные методы
Эти методы представляют собой некую комбинацию фонетических и структурных методов ввода. Простейший пример — метод иньсин (Yinxing — «звучание и форма»). Иероглиф набирается путем ввода транскрипции и указания на графический элемент. Ограниченный набор графических элементов разнесен по клавиатуре, так что запомнить их теоретически не сложно.
На практике системы гибридного ввода постепенно вымирают. Они требуют от пользователя одновременно знания сложной комбинаторики структурных систем и хорошего владения транскрипцией. Проще уж освоить в совершенстве что-то одно.
Так есть ли «стандартный» метод?
А вот и нет. В КНР наибольшей популярностью пользуются структурный метод уби и фонетический пиньинь. На Тайване любят фонетический метод чжуинь (поскольку многие учили в школе именно его, а не пиньинь) и морально устаревший структурный метод цанцзе (Cangjie). Он был изобретен еще в 1976 г. и сохранил с тех пор все свои недостатки: этим методом очень сложно вводить пунктуационные знаки, нужно всегда угадывать правильный способ разбивки иероглифа и помнить сложную раскладку (многие тайваньцы даже наклеивают ее от безысходности на монитор). В Гонконге цанцзе учат в школе и явно предпочитают его всем остальным методам.
Методы, основанные на распознавании
Получается, что ни один из перечисленных методов клавиатурного ввода не является идеальным. Неудивительно, что китайцы решили уцепиться за свою последнюю надежду — распознавание. Сейчас распознавание как речи, так и рукописного ввода входит в стандартный Language pack Windows 7. Предполагается, что перед использованием лучше перевести систему в «обучающийся режим» как минимум минут на 15, чтобы дать ей время привыкнуть к вашему почерку и особенностям речи.
Но методы, основанные на распознавании, так и не получили широкого распространения. Ввод с помощью клавиатуры по-прежнему считается более надежным.
Распознавание устного китайского осложняется тем, что не так велика доля людей, говорящих с идеальным произношением. Диалектные особенности вылезают то тут, то там и портят всю картину. Об иностранцах, для которых освоить четыре тона — уже подвиг, и говорить не приходится.
Рукописный ввод иероглифов представляется делом попроще, к тому же сейчас существует множество PDA, поддерживающих этот метод ввода. Но и этот метод не достиг широкого применения. Дело в том, что китайцы в большинстве своем пишут нечленораздельным курсивом и перестроиться на медленное вырисовывание каждой черты им бывает сложно. Часто проблема в том, что они просто не помнят нормальный порядок черт, потому что привыкли писать сокращенные формы! Вот и выходит, что ввод, основанный на распознавании, годится в основном для изучающих язык, чем активно пользуются онлайн-словари. Например, на сайте популярного Nciku всем желающим предлагается нарисовать нужный иероглиф с помощью мыши, а затем выбрать из предлагаемых системой вариантов:
И все-таки она существует!
Экспериментальная китайская клавиатура, бессмысленная и беспощадная.
Ведь именно так вы ее себе представляли?
Да, да, китайские клавиатуры с тысячами клавиш существуют. Правда по понятным причинам они не идут в серийное производство, оставаясь неким артефактом.
Но, согласитесь, все-таки приятно осознавать, что такая клавиатура где-то есть!
Как выглядит китайская клавиатура? | КТО?ЧТО?ГДЕ?
Все мы привыкли использовать компьютеры со стандартной европейской клавиатурой. На ней всего 105 клавиш. Как правило, клавиатура имеет как русские, так и латинские буквы, которые расположены так, чтобы ими было удобно пользоваться. Многие пользователи набирают текст при помощи слепого метода.
Но многих интересует вопрос, как выглядит китайская клавиатура. Ведь именно китайский язык считается достаточно сложным. В нем более 3000 иероглифов, знать которые просто необходимо для банального чтения газет. Как же уместить все это на 105-ти клавишах привычного нам гаджета?
Как раньше заменяли клавиатуру
Для начала отметим, что около 1,2 миллиарда китайцев активно используют компьютеры. Кроме того, большинство из них абсолютно не владеет английским языком. О возможности создать клавиатуру с тремя тысячами клавиш и речи быть не может. Только представьте, каких размеров должен быть этот гаджет. Пользоваться им будет просто невозможно, не говоря уже об оснащении ноутбуков. Именно поэтому возникла необходимость адаптировать привычную всем версию для китайской письменности.
Ранее китайцы использовали специальные программы, которые могли заменять транслитное написание иероглифами. Проще говоря, пользователь набирал текст в окне программы латиницей, а программа сама переводила его на китайский. Если возможны несколько вариантов написания иероглифов, то пользователю предлагалось выбрать наиболее подходящий из них.
Создание китайской версии
Использование таких программных приложений оказалось очень неудобным. Именно поэтому специалисты стали задумываться о создании специальной клавиатуры. Отметим, что как и любой гаджет, китайская модель должна была позволять написать абсолютно все.
Бытует мнение, что китайская клавиатура имеет очень много клавиш. По своей форме она не такая, какой мы привыкли ее видеть. Она круглая. Якобы такая форма позволяет вместить гораздо больше клавиш, на каждой из которых располагается определенный иероглиф. И это предположение в корне ошибочно. Ведь пользоваться такой клавиатурой просто невозможно.
После изучения множества иероглифов было установлено, что все они строятся при помощи одного и того же набора символов. Данный набор состоит всего из ста пятидесяти знаков, которые и разместили на стандартной европейской клавиатуре. На каждой клавише расположено по три символа. Кроме того, некоторая китайская клавиатура также оснащена и английской раскладкой.
Китайская клавиатура внешне ничем не отличается от той, к которой мы привыкли. Те же клавиши точно в том же порядке. Разве что символов на ней немного больше. Помимо клавиш с символами алфавита, присутствуют также абсолютно все служебные кнопки, которые работают везде одинаково. Вот такая трансформация!
Как выглядит китайская клавиатура?
Прежде чем говорить о том, как выглядит китайская клавиатура, нужно немного узнать о принципах, на которых строится письменная речь этого народа. Всем известно, что для письма в восточных языках используются иероглифы. В некоторых языках существует алфавит, но у китайцев азбуки нет. Каждый иероглиф обозначает слог или даже несколько разных слогов в зависимости от контекста. Но кроме этого, у них есть пиньинь — способ записи слов с помощью букв латинского алфавита и знаков, обозначающих тона, которые также играют важную роль в языке. Сами китайцы пиньинь практически не используют, а вот иностранцам, изучающим язык, этот метод записи сильно облегчает процесс, ведь, по сути, это транскрипция слова. Так что вполне можно знать китайский на достаточно хорошем уровне, при этом совершенно не умея писать или делая это неправильно. Но в современном мире, когда компьютеры, планшеты и телефоны распространены повсеместно, просто невозможно обойтись без письменной речи. Так как же может выглядеть китайская клавиатура?
Запись в электронном виде
Поскольку иероглифы — это не буквы, каждый из них уникален. Даже небольшая ошибка может полностью изменить смысл всего предложения. По оценкам лингвистов, количество иероглифов составляет несколько десятков тысяч. И как же такое количество знаков может уместить китайская клавиатура? Фото рабочего места китайца, наверное,большинство представляют себе в виде нескольких больших панелей со значками, на которых пользователь подолгу ищет нужные знаки, чтобы написать даже самое простое предложение. На самом деле все гораздо проще. Существует два основных способа записи иероглифов в электронном виде: с помощью пиньинь и начертанием. В первом случае пользователь набирает латиницей «расшифровку», после чего ему на выбор предлагается несколько
подходящих вариантов, начиная от самых популярных. Именно этот метод используется чаще всего, а для него, как несложно догадаться, требуются лишь стандартные 26 букв латинского алфавита, так что китайская клавиатура по виду не отличается от стандартной QWERTY. Второй способ можно реализовать, вводя иероглиф мышью или через сенсорный экран. При этом также будут предложены наиболее похожие варианты. Данный способ используется реже, но тоже достаточно популярен, так что и при нем китайская клавиатура не выглядит, как приборная панель в самолете.
Экзотические способы
Как известно, в Азии электронные средства общения получили широкое растроенение. Социальные сети, мессенджеры, обмен сообщениями — все это крайне популярно не только в Японии, но и в Корее и Китае. Для экономии времени и знаков в сообщении азиаты часто используют цифры и их комбинации. Так, на прощание в чате они могут написать «88», поскольку восьмерка у китайцев читается как «ба», что созвучно с английским прощанием bye-bye. По тому же принципу строятся и многие другие комбинации цифр.
Привычное дело
На первый взгляд это может показаться сложным, но азиаты уже привыкли. Особенно часто, что неудивительно, этим методом общения пользуется вечно куда-то спещащая молодежь. Разумеется, в некоторых специальных случаях все-таки применяется китайская клавиатура с большим количеством клавиш, однако для домашнего пользования она не используется.
За несколько тысяч лет хитроумные китайцы успели довести количество иероглифов до 50000 с хвостиком. И хотя число нужных в повседневной жизни знаков не измеряется десятками тысяч, все равно, как ни крути, стандартный набор старой типографии — 9000 литер.
Долгое время набор осуществлялся по принципу «на каждый иероглиф — отдельный печатный элемент». Поэтому работать приходилось с машинками-монстрами вроде этой:Основной ее элемент — банк иероглифов, находящихся на чернильной подушке. Над иероглифами закреплена механическая система: рукоятка, «лапка» для захвата и бобина с листом бумаги. Весь механизм вместе с бобиной вслед за рукояткой способен перемещаться влево, вправо, вперёд и назад за счет усилия машиниста. Чтобы набрать текст, машинист долго ищет с лупой нужный иероглиф, помещает над ним систему и нажатием на ручку приводит в действие «лапку», которая хватает иероглиф и на ходу, разворачивая, отпечатывает его на листе бумаги. При этом бобина с листом немного проворачивается, предоставляя место для следующего символа. Разумеется, процесс печати на таком агрегате выходит крайне медленным — опытный оператор мог набирать не более 11 иероглифов в минуту.
В 1946 году известный китайский филолог Линь Юйтан предложил вариант печатной машинки, построенной на совершенно новом принципе — разложении иероглифов на составные части.Электромеханическая печатная машинка Линь Юйтана, 1946 г.
В отличие от габаритных предшественниц, новая машинка была ничуть не больше своих латинских аналогов, да и клавиш на ней было немного. Дело в том, что клавиши соответствовали не иероглифам, а их составным частям. В центре устройства находился «волшебный глаз»: когда машинист нажимал комбинацию клавиш, в «глазе» появлялся вариант иероглифа. Чтобы подтвердить выбор, нужно было нажать дополнительный функциональный ключ. При наличии всего 64 клавиш такая машинка легко могла обеспечить набор 90,000 знаков и скорость 50 знаков в минуту!Хотя Линь Юйтан умудрился получить на свое изобретение патент в США, в массы оно так и не пошло. Неудивительно, ведь производство одного такого аппарата стоило на тот момент порядка 120,000 долларов. К тому же в день, когда была назначена презентация для компании «Ремингтон», машинка отказалась работать — даже волшебный глаз не помог. Идею благополучно отложили до лучших времен.
Зато в эру широкого распространения компьютеров идея Линь Юйтана о разложении иероглифов на составные части обрела новую жизнь. Она легла в основу структурных методов ввода китайских иероглифов, о которых мы сейчас и поговорим.(Кстати, в 80-е годы тайваньская компания MiTAC даже разработала непосредственно на основании системы кодирования Линь Юйтана свой метод структурного ввода — Simplex.)
Таких методов известно не меньше десятка, и все они основаны на графической структуре иероглифа. Китайские иероглифы — это паззлы, собираемые из одних и тех же частей (т.н. графем). Количество этих графем не так уж велико — 208, и их уже можно «запихнуть» в обычную клавиатуру. Правда, получится около 8 графем на одну клавишу, но эта проблема легко решается.Один из самых распространенных методов структурного ввода — уби цзысин (Wubing zixing — «ввод по пяти чертам»). Как же он работает? Сразу предупреждаю: сложно.
На самом деле все китайские иероглифы делятся на четыре группы:Базовые 5 черт (一, 丨, 丿, 丶, 乙) и еще 25 очень часто употребляемых иероглифов (каждому из них сопоставлена клавиша).
Иероглифы, между графемами которых есть определённое расстояние. Например, иероглиф 苗 состоит из графем 艹 и 田, между которыми есть расстояние (хотя на печати они немного «спрессовываются» и вам может показаться, что расстояния между ними нет).
Иероглифы, графемы которых соединены друг с другом. Так, иероглиф 且 представляет собой графему月, соединённую с горизонтальной чертой; 尺 состоит из графемы 尸 и откидной черты.Иероглифы, графемы которых пересекаются либо накладываются друг на друга. Например, иероглиф 本 — это пересечение графем 木 и 一.
На первый взгляд может показаться, что графемы на клавиатуре расположены беспорядочно. На самом деле это не так. Клавиатура разбита на пять зон, по числу базовых черт, (на рисунке они отмечены разными цветами). Внутри каждой зоны клавиши пронумерованы — от центра клавиатуры к краям. Номер составляется из двух цифр от 1 до 5 — в зависимости о того, из каких базовых черт собирается графема.
Таким образом, 毅=U+E+M+C. Для ввода иероглифов, состоящих более чем из четырёх графем, нужно ввести первые три графемы и последнюю. Поскольку графем очень много, то неизбежно появятся несколько иероглифов, претендующих на одну и ту же комбинацию клавиш. Тогда приходится перебирать варианты, но копьютер умный он по смыслу старается первыми подсовывать наиболее подходящие по смыслу графемы.
Такая раскладка далеко не единственная, но одна из самых популярных. Она хоть и довольно сложна для изучения, но зато открывает возможность слепого ввода, что повышает максимальную скорость набора до 160 иероглифов в минуту — это около 500 нажатий клавиш за ту же минуту!Источник