PDA

Просмотр полной версии : Перекодировщик из UTF-8 в Windows-1251 и обратно


hex
08.03.2010, 18:57
Программа позволяет перекодировать текстовые файлы из кодировки UTF-8 в кодировку Windows-1251, а также добавлять маркер UTF-8, если его нет.

Пример вызова:

utf8_1251.exe test_utf8.xml test.xml


Программа изменяет объявление кодировки в первой строке XML.

Перекодирование из Windows-1251 в UTF-8


Перекодирует XML-файл из кодировки Windows-1251 в UTF8.
Если файл уже в кодировке UTF8, то он остается как есть.
Если файл не содержит маркера кодировки UTF8, то добавляет его.

Вызов win1251_utf8.exe Файл1.xml Файл2.xml

Добавление маркера в UTF-8

Используйте ту же самую программу win1251_utf8.exe для добавления маркера UTF-8.
Если кодировка уже была UTF-8, и был маркер, то файл не изменится.

DeusModus
08.03.2010, 19:02
C меткой порядка байтов сохраняет или без?

Очень важно для меня.

hex
08.03.2010, 19:08
точно ответить наверно не смогу. взял прогу из старых закромов.

могу только сказать, что перекодированный файл точная копия.

CruncH
08.03.2010, 22:47
Для начинающих пользователей Unix систем, ибо более продвинутые уже должны знать это.
Начнем с самого простого
Конвертируем в разные кодировки:
$enca -x нужная_кодировка файл
Информация о кодировке файла:
$enca файл
*не работает с файлами, которые перекодированы в одну и туже кодировку 2 раза
** энка в большинстве случаев опознает кодировку самостоятельно
Более сложный с iconv
$iconv -f исходная_кодировка -t конечная_кодировка исходный_файл [-o дополнительный_файл]
при указанной опции -o исходный файл изменятся не будет.


для более детального изучения работы enca и iconv используем $man enca и $man iconv

BoLT
10.03.2010, 06:20
Если это (http://code.google.com/p/win-iconv/) порт всеми любимого иконва, то стоит попробывать