Bug 24735 - Не учитывает кодировку в SPEC
Summary: Не учитывает кодировку в SPEC
Status: CLOSED WONTFIX
Alias: None
Product: Infrastructure
Classification: Infrastructure
Component: packages.altlinux.org (show other bugs)
Version: unspecified
Hardware: all Linux
: P3 normal
Assignee: Nobody's working on this, feel free to take it
QA Contact:
URL: http://prometheus.altlinux.org/en/Sis...
Keywords:
Depends on:
Blocks: 22555
  Show dependency tree
 
Reported: 2010-12-10 14:07 MSK by Rinat Bikov
Modified: 2021-11-11 20:55 MSK (History)
2 users (show)

See Also:


Attachments
Вот конвертер кодировок на Java (jar-файл) (2.73 KB, application/octet-stream)
2011-03-29 18:05 MSK, Bikov Rinat
no flags Details
Исходный код конвертера (Java). (5.25 KB, application/octet-stream)
2011-03-29 18:07 MSK, Bikov Rinat
no flags Details

Note You need to log in before you can comment on or make changes to this bug.
Description Rinat Bikov 2010-12-10 14:07:59 MSK
Если на sisyphus.ru предполагалось, что spec написан в кодировке koi8-r, то теперь предполагается, что он написан в кодировке UTF-8, а указанные кодировки в Summary(ru_RU.KOI8-R), %description -l ru_RU.KOI8-R  игнорируются.
Comment 1 Igor Zubkov 2011-01-15 03:24:16 MSK
(В ответ на комментарий №0)
> Если на sisyphus.ru предполагалось, что spec написан в кодировке koi8-r, то
> теперь предполагается, что он написан в кодировке UTF-8, а указанные кодировки
> в Summary(ru_RU.KOI8-R), %description -l ru_RU.KOI8-R  игнорируются.

Дело в том что ни sisyphus.ru ни prometheus.a.o ничего в плане спеков и их кодировок не делает. Просто на sisyphus.ru использовалась кодировка KOI8-R для страниц, а на prometheus я сконвертил всё в UTF-8.

Какие предложения по поводу не игнорирования кодировки? И на каких страницах?
Comment 2 Rinat Bikov 2011-01-15 10:44:38 MSK
(В ответ на комментарий №1)
> Какие предложения по поводу не игнорирования кодировки? И на каких страницах?

Есть предложение по обработке последовательности Summary(ln_LN.encoding).
Либо проходить 2 раза, в первый раз в поисках этой последовательности, либо изменять кодировку входных данных на лету после встречи такой последовательности.
Comment 3 Igor Zubkov 2011-01-15 12:49:30 MSK
(В ответ на комментарий №2)
> (В ответ на комментарий №1)
> > Какие предложения по поводу не игнорирования кодировки? И на каких страницах?
> 
> Есть предложение по обработке последовательности Summary(ln_LN.encoding).
> Либо проходить 2 раза, в первый раз в поисках этой последовательности, либо
> изменять кодировку входных данных на лету после встречи такой
> последовательности.

Повторюсь:

> Какие предложения по поводу не игнорирования кодировки? И на каких страницах?

Я пока не понимаю что, где и зачем.
Comment 4 Rinat Bikov 2011-01-15 13:50:08 MSK
Предложение не игнорировать кодировку на странице вывода spec-файла (см. URL для примера).

То есть отсеки с внутренней кодировкой spec-файлов преобразовать в кодировку UTF-8, чтобы далее при отображении этих спек-файлов не было нечитаемых символов.

Сложность в том, что в одном файле могут быть пункты с разной кодировкой:
CP1251, UTF8, KOI8-u.
Comment 5 Igor Zubkov 2011-01-15 14:07:07 MSK
(В ответ на комментарий №4)
> Предложение не игнорировать кодировку на странице вывода spec-файла (см. URL
> для примера).
> 
> То есть отсеки с внутренней кодировкой spec-файлов преобразовать в кодировку
> UTF-8, чтобы далее при отображении этих спек-файлов не было нечитаемых
> символов.
> 
> Сложность в том, что в одном файле могут быть пункты с разной кодировкой:
> CP1251, UTF8, KOI8-u.

Предлагаю не решать политические вопросы техническим путём. Пишите спеки в UTF-8 и проблем не будет.
Comment 6 Igor Zubkov 2011-01-15 14:23:36 MSK
NOTABUG -> WONTFIX
Comment 7 Rinat Bikov 2011-01-15 16:14:10 MSK
Жаль, а интересная задача по идее :)
Да и в policy нигде не видел, чтобы было требование писать в какой-либо одной кодировке...
Comment 8 Igor Zubkov 2011-01-15 16:17:07 MSK
(В ответ на комментарий №7)
> Жаль, а интересная задача по идее :)

Приходите лучше сразу с патчем. :)
Comment 9 Bikov Rinat 2011-03-29 18:05:39 MSK
Created attachment 4851 [details]
Вот конвертер кодировок на Java (jar-файл)

Я написал конвертер кодировок в utf-8.
Comment 10 Bikov Rinat 2011-03-29 18:07:41 MSK
Created attachment 4852 [details]
Исходный код конвертера (Java).

И исходник.
Comment 11 Bikov Rinat 2011-03-29 18:08:44 MSK
Прошу учесть код конвертора :).
Comment 12 Bikov Rinat 2011-03-29 18:42:29 MSK
Вот сложный случай:
http://prometheus.altlinux.org/en/Platform5/srpms/wget/spec
Для него некорректно работает.
Comment 13 Bikov Rinat 2011-03-29 18:57:27 MSK
Нужно найти способ получения кодировки для указанной локали...
Comment 14 Igor Zubkov 2011-06-27 09:18:38 MSK
Уточню один момент. После миграции на ruby 1.9.2 на прометее теперь не показываются спек-файлы которые содержат символы из не UTF-8 кодировки.
Comment 15 Anton Farygin 2021-11-11 20:55:39 MSK
Мы показываем specfile расчитывая что всё в нём написано в UTF-8, а то, что не в UTF-8 отображается нечитаемым образом и это исправляться не будет:
https://beta.packages.altlinux.org/ru/sisyphus/srpms/wallpapers-mike/specfiles/