Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Приложение 1 – версия набора ключей по kanjidic 21 глава




ПРИЛОЖЕНИЕ A – КОД JIS

Для того, чтобы получить более полную информацию по коду JIS, просим обратиться к файлу “japan.inf” Кена Лунде (Ken Lunde), или его книге “Understanding Japanese Information Processing”, выпущенной издательством O’Reilly в 1993 году. Приводим цитаты из файла “japan.inf”:

«Японский набор знаков, как описано в документации JIS X 0208-1990 содержит
6 879 стандартных символов; 6 355 кандзи в двух уровнях (Уровень 1: 2 965 кандзи, упорядоченных по произношению; Уровень 2: 3 390 кандзи, упорядоченных по ключу), 86 символов катаканы, 83 символа хираганы, 10 чисел, 52 латинских буквы, 147 знаков, 66 русских букв, 48 греческих букв и 32 элемента линий (для построения таблиц).

Этот стандарт был впервые установлен в 1978 году и впервые изменен в 1983 (изменен порядок следования символов, изменены некоторые иероглифы, и четыре кандзи добавлены к уровню 2 JIS), и снова изменен в 1990 (к уровню 2 добавлены два кандзи). Этот набор знаков широко применяется на различных платформах. Методы кодирования для стандарта JIS X 0208-1990 включают в себя Shift-JIS, EUC и JIS.”


ПРИЛОЖЕНИЕ B - UNICODE

Приведенная ниже информация о Unicode была предоставлена в 1992 году Ли Коллинзом (Lee Collins) из Taligent.

(Последовательности Unicode представляют собой) «последнее, официальное отображение JIS, представленное документом CJK-JRG (Chinese, Japanese, Korean – Joint Research Group) “Unified Repertoire and Ordering Version 2.0”, который является унифицированным набором символов Han, соответствующим ISO 10646 и Unicode. Все компании, связанные с Unicode (Apple, IBM, Microsoft, NeXT, Taligent и др.) теперь используют именно это отображение. Имела место некоторая путаница в связи с различиями в номенклатуре. Приверженцы Unicode называют его UniHan, китайцы иногда называют его HCS (Han Character Set), а люди ISO называют его “Ideographic CJK Character Unified Repertoire and Ordering”. ISO не могут использовать термин “Han” в связи с тем, что Япония к нему очень чуствительна (даже принимая во внимание тот факт, что термин является прямым переводом “Kanji”) и он не может называться набором символов потому, что лишь ISO WG2 наделена полномочиями кодирования символов. С одной стороны, названный различно, изнутри набор остается одним и тем же.

CJK-JRG образоваласть под эгидой ISO в 1990 году, чтобы исследовать и продвигать набор символов Han к включению в ISO 10646. В ней были собраны всевозможные эксперты по символам набора Han из Китая, Гонгконга, Японии, Кореи, Тайвани и Соединенных Штатов, отобранные по государственным отделениям, участвующим в ISO WG2.

Включая исходные работы в Соединенных Штатах над Unicode и в Китае над GB 13000, которые были в последствии совмещены и стали основой URO, выполнение задания длилось около четырех лет. Работа была закончена в апреле этого года. В результате получен набор из 21 000 символов Han, собранный из всех важнейших стандартов, используемых в Восточной Азии, включая JIS X 0208-1990 и JIS X 0212-1990. Консорциум Unicode предоставляет файл перекрестных ссылок на все источники наборов. Чтобы получить копию, свяжитесь с

Steve Greenfield (Стив Гринфилд)
[email protected]

Если вы хотите иметь более детальные сведения о URO/UniHan, вы, возможно, захотите получить копию "The Unicode Standard Version 1.0 Vol II"., опубликованную Addison Wesley, ISBN 0-201-60845-6. Она доступна в США уже более месяца. Слегка измененный вариант символов – копия 10646 или "Ideographic CJK Character Unified Repertoire and Ordering Version 2.0", должна быть доступна через Австралийский государственный филиал от ISO WG2.


ПРИЛОЖЕНИЕ C – КОД SKIP

S K I P - SYSTEM OF KANJI INDEXING BY PATTERNS
С И К К – СИСТЕМА ИНДЕКСАЦИИ КАНДЗИ ПО КОНФИГУРАЦИИ

[ Этот документ содержит текст и примеры со страниц “New Japanese-English Character Dictionary”, под редакцией Джека Хэлперна (Jack Halpern) и опубликован Kenkyusha (Кенкюся) и NTC. Воспроизводится с разрешения мистера Хэлперна.

В тексте, на котором основан этот документ использовались четыре шаблона, которые не могут быть воспроизведены здесь повторно. Ниже по документу ссылки на эти шаблоны применяются в виде #1 - #4, и относятся к приведенным формам по NJECD:. ■ ■ □ □ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
. ■ ■ □ □ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
. ■ ■ □ □ ■ ■ ■ ■ ■ □ □ ■ ■ ■ ■ ■. ■ ■ □ □ □ □ □ □ ■ □ □ ■ ■ ■ ■ ■. ■ ■ □ □ □ □ □ □ ■ ■ ■ ■ ■ ■ ■ ■. ■ ■ □ □ □ □ □ □ ■ ■ ■ ■ ■ ■ ■ ■. #1 #2 #3 #4. СЛЕВА- СВЕРХУ- ЗАМКНУТЫЙ ЦЕЛЬНЫЙ. СПРАВА СНИЗУ ]. КАК НАЙТИ ЭЛЕМЕНТ A. Определить SKIP-номер вашего символа ШАГ 1 ИДЕНТИФИЦИРОВАТЬ ШАБЛОН Определите, к какому из четырех ШАБЛОНОВ относится ваш символ, чтобы получить первую часть SKIP-номера (НОМЕР ШАБЛОНА). Если ваш символ принадлежит к шаблонам #1, #2 или #3 (相→#1), придерживайтесь шагов, перечисленных в левом столбце; если он принадлежит к шаблону #4 (下→#4), следуйте шагам в правой колонке. (ССЫЛКА: R4. Как идентифицировать шаблон).. #1 #2 #3 #4
ШАГ 2РАЗДЕЛИТЕ СИМВОЛРазделите символ на две части в точке первого деления [相=木+目]. ССЫЛКА: R5. Как Разделить символ. ШАГ 3ПОДСЧИТАЙТЕ КОЛИЧЕСТВО ЧЕРТ В ЗАТЕНЕННОЙ ЧАСТИПодсчитайте количество черт в ЗАТЕНЕННОЙ ЧАСТИ чтобы получить вторую часть SKIP-номера [相 #1 1-4-]. ССЫЛКА: ПРИЛОЖЕНИЕ 2. Как вычислять количество черт. ШАГ 4ПОДСЧИТАЙТЕ КОЛИЧЕСТВО ЧЕРТ В СВЕТЛОЙ ЧАСТИПодсчитайте количество черт в СВЕТЛОЙ ЧАСТИ чтобы получить третью часть SKIP-номера [相 #1 1-4-5]. ССЫЛКА: Приложение 2. Как вычислять количество черт. ОТСУТСТВУЕТ(Поскольку цельные символы не могут быть разделены, перейдите к ШАГУ 3.) ССЫЛКА: R6. Как определить подкласс цельного шаблона. ОПРЕДЕЛИТЕ ОБЩЕЕ КОЛИЧЕСТВО ЧЕРТ Определите общее количество черт в вашем символе чтобы получить вторую часть SKIP-номера [下 #4 4-3-]. ССЫЛКА: Приложение 2. Как вычислять количество черт. ОПРЕДЕЛИТЕ ПОДКЛАСС ЦЕЛЬНОГО ШАБЛОНАОпределите, к какому из четырех ПОДКЛАССОВ ЦЕЛЬНЫХ ШАБЛОНОВ относится ваш символ чтобы получить третью часть SKIP-номера. Выбирайте из: ` ̄' 1, `_' 2, `|' 3 или `■' 4. [下 #4 4-3-1]. ССЫЛКА: R6. Как определить подкласс цельного шаблона.
После определения SKIP-номера вашего символа, отыщите ваш символ, следуя одниу из предложенных путей: 1. Определите номер вхождения в Списке Шаблонов на странице 1952, затем найдите ваш символ в главной части словаря. Более подробно - см. R3.1.2 Метод Индексов. 2. Найдите ваш символ непосредственно по его SKIP-номеру (не обращаясь к Списку Индексов). Более подробно – см. R3.1.3 Непосредственный Метод. ЗАМЕТКА: Все ссылки, которым предшествует метка раздела (R) относятся к СИСТЕМЕ ИНДЕКСИРОВАНИЯ КАНДЗИ ПО КОНФИГУРАЦИИ, начинающейся на странице 106а. КАК ИДЕНТИФИЦИРОВАТЬ ШАБЛОН ОПРЕДЕЛИТЕ К КАКОМУ ИЗ ЧЕТЫРЕХ ШАБЛОНОВ ОТНОСИТСЯ ВАШ СИМВОЛ #1 Символ, который может быть разделен на левую и правую частиВЕРНО: 相 4-5 八 1-1 順 1-11 扱 3-3НЕВЕРНО: 片 1-3 用 1-4 可 3-2 多 3-3 #2 Символ, который может быть разделен на верхнюю и нижнюю частиВЕРНО: 二 1-1 寺 3-3 古 2-3 春 5-4НЕВЕРНО: 万 1-2 考 4-2 間 8-4 坐 4-3 #3 Символ, в котором может быть выделен окружающий элементВЕРНО: 進 3-8 広 3-2 問 8-3 国 3-5НЕВЕРНО: 入 1-1 呉 4-3 名 3-3 為 5-4 #4 Символы, которые не подходят к шаблонам #1, #2 или #3ВЕРНО: 雨 8-1 兵 5-2 中 4-3 与 3-4НЕВЕРНО: 刀 2-1 日 4-1 水 4-3 ЕСЛИ СИМВОЛ МОЖЕТ БЫТЬ РАСПОЗНАН КАК ОТНОСЯЩИЙСЯ К БОЛЕЕ ЧЕМ ОДНОМУ ШАБЛОНУ, ВВЫБЕРИТЕ ТОТ ШАБЛОН, КОТОРЫЙ СООТВЕТСТВУЕТ ИСХОДНОЙ КОНСТРУКЦИИ СИМВОЛА ВЕРНО: 児 2-5-2 箱 2-6-9НЕВЕРНО: 児 1-2-5 箱 1-7-8 КАК РАЗДЕЛИТЬ СИМВОЛ РАЗДЕЛИТЕ СИМВОЛ НА ДВЕ ЧАСТИ ПО ПЕРВОЙ ТОЧКЕ ДЕЛЕНИЯ #1 Продвигаясь слева направо разделите символ у первого разрыва.ВЕРНО: 明 4-4 小 1-2 扱 3-3НЕВЕРНО: 小 2-1 街 9-3 #2 Продвигаясь сверху вниз, разделите символ у первого разрыва, горизонтальной линии, или вложенного элемента, в зависимости от того, что обнаружится первым. ВЕРНО: 三 1-2 脅 2-8 赤 3-4 古 2-3НЕВЕРНО: 三 2-1 脅 6-4 赤 2-5 下 1-2 #3 Провигаясь от внешней стороны внутрь, разделите символ по первому окружающему элементу.ВЕРНО: 度 3-6 進 3-8 閉 8-3 目 3-2НЕВЕРНО: 度 7-2 磨 11-5 НЕ НАРУШАЙТЕ ПРИНЦИПОВ ЦЕЛОСТНОСТИ ЭЛЕМЕНТОВ. 1. Никогда не разрывайте черты. ВЕРНО: 凶 3-2-2 НЕВЕРНО: 凶 1-1-4. 2. Никогда не разрывайте неделимые части. ВЕРНО: 情 1-3-8 НЕВЕРНО: 情 1-1-10. 3. Не совершайте сложных делений. ВЕРНО: 気 3-4-2 НЕВЕРНО: 気 2-2-4 КАК ОПРЕДЕЛИТЬ ПОДКЛАСС ЦЕЛЬНОГО ШАБЛОНА A. ОПРЕДЕЛИТЕ К КАКОМУ ИЗ ПОДКЛАССОВ ЦЕЛЬНЫХ ШАБЛОНОВ ОТНОСИТСЯ ВАШ СИМВОЛ ` ̄' 1. Символ имеет линию сверхуВЕРНО: 雨 8-1 下 3-1 耳 6-1 果 8-1НЕВЕРНО: 刀 2-1 千 3-2 垂 8-1 兵 5-1 `_' 2. Символ имеет линию снизуВЕРНО: 上 3-2 兵 5-2 垂 8-2НЕВЕРНО: 山 3-2 包 5-2 者 8-2 `|' 3. Символ содержит пересекающую линиюВЕРНО: 中 4-3 東 8-3 毛 4-3НЕВЕРНО: 水 4-3 寸 3-3 午 4-3 弟 7-3 `■' 4. Символы, которые не содержат линий сверху, снизу или пересекающих линийВЕРНО: 与 3-4 大 3-4 寿 7-4НЕВЕРНО: 糸 6-4 久 3-4 友 4-4 劣 6-4 B. ЕСЛИ СИМВОЛ МОЖЕТ БЫТЬ ОТНЕСЕН К БОЛЕЕ ЧЕМ ОДНОМУ ПОДКЛАССУ, ПРЕИМУЩЕСТВО ОТДАЕТСЯ К ПОДКЛАССУ С МЕНЬШИМ НОМЕРОМВЕРНО: 王 4-1 己 3-1 酉 7-1 果 8-1 出 5-2 生 5-2 甲 5-1НЕВЕРНО: 王 4-2 己 3-2 酉 7-2 果 8-3 出 5-3 生 5-3 甲 5-3
Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...