[РЕШЕНО как-то]кодировка текстового файла. Слетела.

Браузеры, почтовые клиенты, офисные пакеты, файловые менеджеры, редакторы и т.п.
Ответить
lnx
Сообщения: 299
Зарегистрирован: 24.08.2022

#

Коллеги, вот есть текстовые файлы, открываю их Geany. И все было чудесно до сего дня. Sway. И не говорите, что "он ни при чем", подумываю даже о миграции на i3. Он при всем, в том же палемуне рандомно могут не раскрываться паки закладок до перечтения конфига sway, но сейчас не об этом. Перезагрузил sway и оба на, текстовой файл, который только что был с русскими буквами на экране, октрылся с мутью. Попытка перечитать файл как UTF-8 успеха не дает. Открываем его же в vi и там та же картина + пишет внизу - [изменена кодировка]. Из всех тот момент открытых файлов пострадал только один, в остальных русский язык на месте.

Вместо -
декабрь

пишет -
декабрь.


Декодер https://2cyr.com/decode/?lang=ru утверждает, что это WINDOWS-1251, но попытка перечитать в Geany как вин 1251 результата не дает. ДА и скакого перепугу, я явно не менял кодировкуу, команду на ее смену не давал. В резервной копии проверил - явно забита UTF-8/

Как починить?
Последний раз редактировалось lnx 15.09.2025 19:58, всего редактировалось 1 раз.
Arhei
Сообщения: 63
Зарегистрирован: 04.07.2025

#

сбой скорее всего в редакторе
преобразование
$ echo "декабÑÑ" | iconv -t latin1
декабрь
для файла
$ iconv -t latin1 -o OUT.txt IN.txt
lnx
Сообщения: 299
Зарегистрирован: 24.08.2022

#

Arhei: для файла

$ iconv -t latin1 -o OUT.txt IN.txt
Размер был в резервной копии 2.1мб, со поломавшейся кодировкой 3.8мб, после команды 2.1мб. Но вид без изменений.
Видимо надо как-то задать выходную кодировку
Arhei
Сообщения: 63
Зарегистрирован: 04.07.2025

#

lnx:Но вид без изменений.
скиньте куда нибудь кусочек файла с 1-2 предложениям
lnx
Сообщения: 299
Зарегистрирован: 24.08.2022

#


cat кодировка | iconv -t latin1
С Матрикосм есть прогресс, но небольшой.

а если из файла в файл - то нет результатат. Напрашивается типа -
cat кодировка | iconv -t latin1 > результат
Но если это выполнить, то результат нулевой, крякозяблы что в vi, что в geany. А если просто вывод в консоль, то буковки русские.
locale
LANG=ru_RU.UTF-8
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=


Вложения
кодировка.zip
(332 байт) 3 скачивания
Arhei
Сообщения: 63
Зарегистрирован: 04.07.2025

#

странно, ваш файл декодируеться без проблем, хоть напрямую хоть через файл
$ iconv -t latin1 кодировка
В кабинете около полуночи заедают комары.
С Матрикосм есть прогресс, но небольшой. Спать пошел во втором часу
$ iconv -t latin1 -o OUT.txt кодировка
$ cat OUT.txt 
В кабинете около полуночи заедают комары.
С Матрикосм есть прогресс, но небольшой. Спать пошел во втором часу
п.с.
также и с вашим примером отрабатывает нормально
$ cat кодировка | iconv -t latin1 > результат
$ cat результат 
В кабинете около полуночи заедают комары.
С Матрикосм есть прогресс, но небольшой. Спать пошел во втором часу
да и разные редакторы от nano до zed декодированный файл читают хорошо
Последний раз редактировалось Arhei 15.09.2025 19:35, всего редактировалось 1 раз.
lnx
Сообщения: 299
Зарегистрирован: 24.08.2022

#

Я получил аналогичный результат. Т.е. задачу восстановления я решил (найдя разные варианты решения). Но причину не понял. В попытках переоткрыть, изменить кодировку исходное состояние поврежденного файла уже не восстановить, но после серии трансформаций стало ругаться на ошибки типа -
iconv: недопустимая входная последовательность в позиции 775
Анализируя файл резервной копии отметил, что это место с тегом даты (не использую, но ошибочное нажатие ctrl+d могло иметь место). И в итоге попробовал в Geany через меню Открыть - Загрузить заново как - Без кодировки. И русские буковки на месте. Но файл резервной копии явно указан как UTF-8. Теперь на экране буковки вижу нужные в Geany, тег даты убран,
iconv -t latin1 -o OUT.txt битый
iconv: недопустимая входная последовательность в позиции 0
Вбил первое слово - привет, результат тот же, iconv: недопустимая входная последовательность в позиции 0.

Махнуть рукой, ибо как таковая проблема с сохранностью содержания решена, конечно религиозно не выдержанно, но очень соблазнительно.
Вложения
screen_20250915-193624.jpg
(10.68 КБ) 0 скачиваний
Arhei
Сообщения: 63
Зарегистрирован: 04.07.2025

#

lnx: Вбил первое слово - привет, результат тот же, iconv: недопустимая входная последовательность в позиции 0.
это просто уже другая кодировка не latin1
$ echo "привет" | iconv -t latin1
iconv: недопустимая входная последовательность в позиции 0
$ echo "привет" | iconv -t utf-8
привет
lnx
Сообщения: 299
Зарегистрирован: 24.08.2022

#

Arhei:это просто уже другая кодировка не latin1
Спасибо за оперативную и конструктивную помощь.
А чего-то, что само бы там внутри себя молча разобралось с кодировками, нет ли?
Arhei
Сообщения: 63
Зарегистрирован: 04.07.2025

#

lnx: А чего-то, что само бы там внутри себя молча разобралось с кодировками, нет ли?
этот инструмент прямой как лопата, что сказали то и делает, а подгонка и вариации то наверное уже нада к ИИ )
Ответить