Перекодировка хаков из cp1251 в utf8 и наоборот

Н

Ночная странница

#1
Перекодировку советую делать в удобной онлайн-программке с vbsupport.org, она предназначена именно для этого.

Для файлов XML ставим галочку в пункте:
Пытаться изменить кодировку в мета-тегах и заголовке xml файла (только для vBulletin), переключатель устанавливаем на нужный вид перекодировки и грузим файл. Сохраняем уже перекодированный.

Переконвертировать нужно обычно не все файлы, а лишь сами продукты, но бывают и исключения. Если какой-то файл содержит русские буквы, а вы его не перекодировали, в utf8 вы увидите пустые квадратики.

Если где-то вдруг вылезут квадратики - вы теперь знаете, что делать. Будут проблемы - пишите :)

Добавлено Льюви

1. Иногда, редко, разработчик хака прописывает создание таблиц/полей_таблиц сразу в нужной ему кодировке
простая переконвертация кодировки продукта нЕ даст нужного эффекта
для страховки следует открыть хмл продукта нормальным текстовым редактором и поискать, нет ли в продукте прямого указания кодировки
для тех, кому сложно вчитываться в инсталлкод: достаточно проверить поиском 1251 и utf
если ничего не нашлось - с Богом, устанавливайте
если нашлось - меняйте или спрашивайте, будем смотреть

2. Иногда, крайне редко, работа хака зависит напрямую от кодировки
как пример - моя инструкция по обучению хака статей понимать утф
если файл.пхп или продукт.хмл, заточенный под конкретную кодировку, бездумно перетащить на другой форум (даже сменив кодировку самого хмл) - результаты могут быть... непредсказуемы

3. При перекодировке языкового файла всегда смотрите, не прописан ли charset прямо в этом файле (открыть редактором, поиск слова charset)
 
W

Wmboard

#2
Перекодировка делается в блокноте в два клика :) Собственно никакие мудреные программы не нужны.
 
Н

Ночная странница

#3
Veter, я бы посоветовала блокнот, да, и сама умею, но проблема вот в чем:

Он оставляет сигнатуру, которая может привести к ошибке при загрузке .xml и работе с .php файлами (например, если конфиг в юникоде)
 
W

Wmboard

#4
Я пользуюсь AkelPad. Никогда не было проблем :)
Собственно ссылочка есть в первом посте. А где человеку удобнее перекодировать сам решит.
 
Н

Ночная странница

#5
Я поинтересовалась и выяснила, что за сигнатуру оставляет при перекодировке виндосовский блокнот. Это так называемый BOM (Byte Order Mark), несколько символов, невидимых в документе, но создающих много помех и вызывающих ошибки в браузерах.

Если у вас кодировка utf-8, проверьте свои файлы на наличие БОМа:
загрузите в корневую директорию файл из вложения и наберите в адресной строке:
ваш домен/find_bom.php
Список файлов с BOM или надпись All clear, sir! (всё чисто, сэр!) определят ваш дальнейший план действий. При наличии файлов с BOM их нужно перекодировать, а при их отсутствии - порадоваться и не списывать ошибки на неправильную перекодировку хаков.

Если надо проверить всего один-два файла, воспользуйтесь онлайн-сервисом.
 
H

Horst1

#6
Сасибо :) Помогло :good:
 
П

Прометей

#7
В Акепаде всё это не нужно: там этот Бом можно снимать и ставить самому. Пользуюсь этой программой постоянно для смены кодировки хаков - ни разу меня не подводила. А он лайн сервисы - к лешему:) Когда есть более простое решение. Что для проверки форума на Бомы - если изначально пользоваться Акепадом необходимости в этом не возникает.

Добавлено через 4 минуты
Перекодировку советую делать в удобной онлайн-программке с vbsupport.org, она предназначена именно для этого.
Кстати, Вам попадались хаки в которых часть фраз написана в windows 1251, а часть в utf 8? Скажите мне, пожалуйста, как Вы будете переводить подобное этим сервисом?)))))))
 
Л

Льюви

#8
если мне не изменяет память, про конвертацию БД была отдельная тема (и, сдаётся, даже не одна))
вот, например: Исправление кодировки базы данных своими силами на vBulletin
может, лучше почитать и продолжить разговор там?

===
по поводу перекодировки хаков

Ночная странница, не откажи в любезности, добавь в первый пост примерно такое:

1. Иногда, редко, разработчик хака прописывает создание таблиц/полей_таблиц сразу в нужной ему кодировке
простая переконвертация кодировки продукта нЕ даст нужного эффекта
для страховки следует открыть хмл продукта нормальным текстовым редактором и поискать, нет ли в продукте прямого указания кодировки
для тех, кому сложно вчитываться в инсталлкод: достаточно проверить поиском 1251 и utf
если ничего не нашлось - с Богом, устанавливайте
если нашлось - меняйте или спрашивайте, будем смотреть

2. Иногда, крайне редко, работа хака зависит напрямую от кодировки
как пример - моя инструкция по обучению хака статей понимать утф
если файл.пхп или продукт.хмл, заточенный под конкретную кодировку, бездумно перетащить на другой форум (даже сменив кодировку самого хмл) - результаты могут быть... непредсказуемы

3. При перекодировке языкового файла всегда смотрите, не прописан ли charset прямо в этом файле (открыть редактором, поиск слова charset)
 
Н

Ночная странница

#10
Ночная странница, не откажи в любезности, добавь в первый пост примерно такое:

Увы и ах, с модераторскими правами пропала возможность редактировать как свои, так и чужие сообщения.

Veter, не откажи в любезности? :)

Кстати, с момента написания первого поста я тоже научилась и привыкла править хаки в Notepad++ , но новичкам все же советую этот сервис.
 
П

Прометей

#11
если мне не изменяет память, про конвертацию БД была отдельная тема (и, сдаётся, даже не одна))
вот, например: Исправление кодировки базы данных своими силами на vBulletin
может, лучше почитать и продолжить разговор там?
Прошу прощения, но я говорил о фразах в различных кодировках что встречаются в ПРОДУКТАХ хаков.

Кстати, Вам попадались хаки в которых часть фраз написана в windows 1251, а часть в utf 8? Скажите мне, пожалуйста, как Вы будете переводить подобное этим сервисом?)))))))
Ну где тут хоть буква про БД? :D
Всё это я писал в защиту программы AkelPad text editor которой пользуюсь сам - в ней есть всё нужное для перекодировки хаков. В ней же я и перекодировал фразы, если встречал в одном продукте их и в cp1251 и в utf8. Такое хоть и редко, но бывает.
 
Л

Льюви

#12
Прошу прощения, но я говорил о фразах в различных кодировках что встречаются в ПРОДУКТАХ хаков.
я уже не помню, что тут было в апреле... :pardon:

Кстати, Вам попадались хаки в которых часть фраз написана в windows 1251, а часть в utf 8?
мне - нет, не попадалось
и мне кажется, что такой винегрет сделать даже специально - физически невозможно
 
П

Прометей

#13
и мне кажется, что такой винегрет сделать даже специально - физически невозможно
Знаете, и я до сих пор в недоумении: ну как это смогли сделать-то?:D Что за хак был уже и не припомню. Но он был, один всего такой.
 
Л

Льюви

#14
Что за хак был уже и не припомню. Но он был
очень интересно...
если вдруг вспомните - я была бы очень благодарна за ссылку

Знаете, и я до сих пор в недоумении: ну как это смогли сделать-то?
ну.. в принципе... если пофантазировать... скажем, Ворд + скопированный на клипборд текст в другой кодировке... то тогда...
просто вспомнила: была ж инструкция по редактированию js файла в Ворде (было, было, дамы и господа, могу предъявить ссылку на тему))
так что я, наверное, погорячилась насчёт "физически невозможно" - есть ещё умельцы, есть... :D
 
П

Прометей

#15
Тут на мой взгляд важен не сам хак, а проверка того, что ставишь в обязательном порядке на соответствие кодировке. Однажды (не помню откуда) я скачал какой-то хак. Там просто был указан продукт без указания в его названии в какой он кодировке. Я по привычке ставлю его на форум что у меня был в cp1251. И - крякозябры :). Оказывается продукт хака был в utf8 :D.
Так что мой совет начинающим веб мастерам: не ставьте продукт хака бездумно. Проверяйте всё прежде чем что-либо ставить, а перед серьёзными изменениями ВСЕГДА!! делайте бекапы. На своём опыте давно убедился, что лучше перебздеть, чем недобздеть :) Перестраховка в веб мастеринге ни когда не бывает лишней.

Добавлено через 5 минут
чень интересно...
если вдруг вспомните - я была бы очень благодарна за ссылку
Кажется вспомнил, но за точность не ручаюсь: нет времени что бы проверить это. Кажется это был хак с Бормотухи на ложную Админку. Если у Вас есть время, гляньте, пожалуйста. Кажется именно в нём я мудохолся с фразами в utf8 кодировке (а сам хак был в cp1251).
 
П

Прометей

#17
Потому и не дал ссылку сразу, что нет уверенности что я прав, что ошибка именно в этом хаке. Сейчас его установил на Денвере и вижу что это что-то не то: в том хаке, что я помню, нужно было править файлы указывая адрес форума. Тут я вижу правка вообще не нужна. Вообще мало понятна логика этого хака: ну ладно, я делаю всё что сказано в инструкции. А что тогда с реальной Админкой? Раньше когда я ставил подобный хак я правил файл конфига указывая в нём реальный адрес Админки. Тут этого не нужно. А если удалить файлы, как этого просят в инструкции, из каталога Админки и залить туда ЭТО, то как тогда попасть в реальную Админку? Постоянно вбивая её адрес руками? Бред.. Да и будет ли она работать после удаления файлов из её каталога?
Так что проверить особо мне не удалось, простите. Неужели есть ещё другое описание этого же, но рабочее? Так же не нашёл файла в котором был бы русский текст ложной Админки. Правда, за неимением времени я не просматривал внимательно 3 000 строк кода в одном из файлов.
P.S.
Для Модераторов форума
Модераторов прошу ссылку на форум Бормотухи не удалять - я её оставил для Льюи.
 
Get involved!

Here you can only see a limited number of comments. On СЕО Форум Вебмастеров you see all comments and all functions are available to you. To the thread