КОИ-8
КОИ-8 (Код Обмена Информацией, 8 бит), KOI8 — восьмибитный стандарт кодирования символов в информатике. Разработан для кодирования букв кириллических алфавитов.
Кодировка описана в ГОСТ 19768-74 (сейчас недействителен). Существует также семибитная версия кодировки — КОИ-7.
Разработчики КОИ-8 поместили символы русской кириллицы в верхней части расширенной ASCII таблицы таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читабельный» текст, хотя он и написан латинскими символами. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.
В данной таблице указано расположение русских букв в второй половине расширенной кодовой таблицы.
KOI8-R стал фактически стандартом для русской кириллицы в юникс-подобных операционных системах.
Существует несколько вариантов кодировки КОИ-8 для различных кирилических алфавитов. Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U.
Кодировка KOI8-R используется в большинстве компьютерах, работающих под OS UNIX на территории бывшего Советского Союза.
С легкой руки - RELCOM'a (родоначальника Internet в нашей стране) эта кодировка получила название "Русская сетевая кодировка" (Russian Network Code). Кодировка зарегистрирована в Internet Architecture Board (IAB) в июле 1993 г. (см. RFC1489 ).
Указатель MIME этой кодовой таблицы для HTML документов имеет вид: "Content Type: text/html; charset=KOI8-R"
По набору символов KOI8-R соответствует одному из вариантов альтернативной кодировки. Стандарт RFC 1489 также предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более-менее понятным. Например, в чешском варианте КОИ-8 буквы Cc должны превращаться в cC, Zz — в zZ и т. д. В настоящее время эти кодировки не используются.
|