Программы перекодировки

XCode converter. Бесплатная универсальная программа под DOS, перекодирующая между CP866, KOI8, CP1251, MAC и ISO8859-5, с возможность автораспознавания кодировки и автодекодирования, в том числе для ряда "извращенных" - двойных перекодировок. К сожалению, перекодировка CP866-KOI8 в ней неверна (за что не может быть названа KOI8-R) за пределами русских букв. А это, в частности, не позволяет программе распознавать двойные перекодировки, если среди них имелся корректный вариант перекодировки CP866->KOI8 или KOI8->CP866.

XCode converter с исправленными таблицами CP866->KOI8-R и KOI8-R->CP866. В таком виде программа годится и в качестве стандартного перекодировщика, и в качестве дешифратора в тех случаях, где пока бессильны другие.

TOT-Recode (версия 1.5). Бесплатная программа, которая автоматически подбирает схему перекодировки аналогично Mail Reader (и так же поддерживает кодировку Quoted-Printable), имеет пакетный режим, но с ограничением размера файла в 30 кб, без поддержки "обрезания восьмого бита в стиле Compuserve" и без поддержки Unicode.

Штирлиц. Универсальная программа перекодировки и восстановления текста Всеволода Лукьянина: работает со схемами, понимает win/koi/dos/iso/mac/lat, unicode; имеет множество настроек, в том числе количества уровней перекодировки (до 10). Раскодирует Quoted-Printable, UUEncode, XXEncode, Base64, BinHex (Hqx7), а также аналогичные Quoted-Printable интернетовский формат типа %C0%C1 и RTF-формат (формат \'c7). Работает с HTML-документами, которые может перекодировать в текстовый вид. В версии 4 появилась поддержка юникодовых кодировок (UTF-7/UTF-8) и юникодовых номеров в HTML (вида &1040;). Бесплатно (в версии 4 имеется окошко с рекламой).

E-Coder. Универсальная программа перекодировки и восстановления текста (под Win32) Александра Горлача. В декабрьской 1998 г. версии 1.2 в ней - впервые в такого рода программах - появилась поддержка UTF-7/UTF-8. Возможно ручное и автоматическое декодирование текста (до 4-х наслоений перекодировок), понимает win/koi/dos/iso/mac, unicode, utf-7/utf-8, раскодирует BinHex 4.0, Uuencode/Uudecode, Base64, Quoted-Printable, а также аналогичные Quoted-Printable интернетовский формат типа %C0%C1 и RTF-формат (формат \'c7). Неверно перекодирует CP866-KOI8, не без некоторых других "глюков".

CODEPAGE. Бесплатная универсальная FIDO-ориентированная программа Александра Коростина восстановления нечитаемых текстов, работающая под DOS. Знает 17 однобайтовых русских кодировок, поддерживает Quoted-Printable, транслитерацию (в нескольких вариантах), Unicode text и др. В последних версиях научилась декодировать UTF-7/UTF-8. Интегрируется с GoldEd и работает с почтовыми ящиками Dmail.

FROMDOS и TODOS - пара программ под DOS, отличающихся только названиями, которые корректно перекодируют из CP866 в KOI8-R и обратно. Естественно, бесплатно.

Цифирица. Написанный Романом Кошелевым интеллектуальный перекодировщик (под Win32) в транслит и из транслита, с элементами англо-русского переводчика и настраиваемыми правилами транслитерации и перевода. Бесплатно. На сайте цифирица предлагается также в качестве web-сервиса.

CPAGE - макроc для MultiEdit 7.0. Написанный Пашей Бижаном в русле Xcode перекодировщик DOS - KOI8-R - WIN - ISO - MAC в форме макрокоманды для MultiEdit версии 7 DOS/Win (таким пришел), MEW8.0 и старше. По сравнению с исходным вариантом мной исправлены таблицы перекодировки DOS - KOI8-R, а также улучшены (как мне кажется) алгоритмы перекодировки в другие кодовые страницы, где взаимнооднозначное соответствие невозможно. В последних версиях (jan-99) добавлены юникодовые кодировки (UTF-7, UTF-8 и Unicode text; для всех, наконец, и кодер, и декодер). Эвристические возможности XCode и работа с двойными перекодировками в макросе отсутствуют.

WPVIEW 4 patch. Модификация WPVIEW от Norton Commander 4, заменяющий формат XyWrite на Koi8-r с корректной таблицей перекодировки. При этом, правда, в заголовке окна показывается неверный формат, но в остальном все работает правильно.

Могут встречаться и более сложные виды искажения русского текста. Для чтения таких сообщений можно использовать программу Mailreader. Полное описание этой программы и условия приобретения можно прочитать по адресу:.

Agama Mail Reader. Это универсальный перекодировщик, очень интересная по идее программа, причем вполне работающая. Однако, как уже говорилось, некоторые идеи, содержащиеся в ее описании, вызывают резкие возражения. Программа представляет собой текстовый редактор и вставку к MS Exchange и позволяет восстанавливать тексты, которые первоначально существовали в одной из пяти наиболее популярных русских кодировок, а затем подверглись нескольким перекодировкам (именуемым в программе фильтрами), допускается до четырех последовательно примененных фильтров, в совокупности образующих схему перекодировки. Каждая из перекодировок может быть одной из восьми (а может отсутствовать, под 1000 понимается mac-кодировка - CP10007): dos-windows, koi8-windows, 437-1252, windows-dos, windows-koi8, 1252-437, 1000-1252, 1000-437. Кроме того, в качестве отдельных то ли фильтров, то ли схем существует "транслитерация" (не настраиваемая) и т.наз. "потеря 8-бита в стиле Compuserve" (когда все латинские буквы в старшей части таблицы ISO-8859-1, имеющие диакритические знаки - точки, крышечки и т.п., - превращаются в соответствующие буквы без этих знаков). Последняя схема называется "кошмар", что примерно соответствует получающейся картине для русских букв.

Всего авторы программы насчитали 8293 схемы перекодировок, 99% которых, по-видимому, существуют только в их больном воображении (саму математику я нисколько сомнению не подвергаю). Действует функция автоматического определения подходящей схемы, основанная, видимо, на параметрах частотности русских букв и буквосочетаний и орфографическом словаре. Имеется и обратная функция - закодировать по указанной схеме. По идее она предназначена для того, чтобы отправить закодированное письмо обратно, и оно, пройдя через те же перекодировки в обратном порядке, к отправителю пришло бы в читаемом виде - пожалуй, наиболее бредовая и наиболее идущая вразрез со стандартами идея в концепции программы.

Но как бы то ни было, программа прекрасно справляется со стандартными и двумя основными извращенными кодировками, а также с другими подобными. Некоторым неудобством является то, что результат всегда представляется в Windows-кодировке, однако можно использовать функцию кодирования для получения результата в любой нужной кодировке. Программа также вполне пригодна для кодирования/декодирования транслитерированного текста, но если способ транслитерации отличается от того, что в ней заложен, требуется еще довольно много ручной правки - как и для любой другой аналогичной программы. Программа может расшифровать и Quoted-Printable, но ничего не знает ни о Base64, ни и о юникодовых форматах. Более того, среди основных перекодировок отсутствуют канонические и взаимно однозначные koi8-dos и dos-koi8, в итоге Mail Reader не справляется с одним из нечастых, но реально существующих, в основном, среди пользователей UUPC "одношаговых" извращений: текст в DOS-кодировке, перекодированный канонической функцией (koi8->dos).

TBN.ru - ????, ??????? ?? ????????
зоо секс. интернет бизнес. . Холодильники. варочные поверхности бытовая техника.. Коммерческие доски объявлений: автоуслуги, авто, мотоцикл. Всё для офиса в Минске: Ноутбуки, фотоаппараты, факсы. весільні сукні. Электрокалорифер ЭКО. elica