Bug 48467

Summary: find-lang: missing "zh_Hans" support
Product: Sisyphus Reporter: Yuri N. Sedunov <aris>
Component: rpm-buildAssignee: placeholder <placeholder>
Status: NEW --- QA Contact: qa-sisyphus
Severity: major    
Priority: P5 CC: aen, arseny, demitelinevazhno, glebfm, imz, ldv, placeholder, sem, vt
Version: unstable   
Hardware: all   
OS: Linux   
Bug Depends on:    
Bug Blocks: 46625    

Description Yuri N. Sedunov 2023-11-16 14:51:53 MSK
warning: Installed (but unpackaged) file(s) found:
    /usr/share/locale/zh_Hans/LC_MESSAGES/re.sonny.Junction.mo

find-lang не ловит упрощенный китайский.
https://www.localeplanet.com/icu/zh-Hans/index.html
Comment 1 AEN 2023-11-16 14:58:38 MSK
Коллеги, это теперь важно. 
Юрий, спасибо.
Comment 2 Mikhail Efremov 2023-11-16 17:23:33 MSK
(In reply to Yuri N. Sedunov from comment #0)
> warning: Installed (but unpackaged) file(s) found:
>     /usr/share/locale/zh_Hans/LC_MESSAGES/re.sonny.Junction.
> find-lang не ловит упрощенный китайский.

Насколько я помню find-lang знает только те языки, которые поддерживаются в glibc.

> https://www.localeplanet.com/icu/zh-Hans/index.html

Я, конечно, совсем не спец в китайском, но насколько я понял немного погуглив, полезность локали zh_Hans под большим вопросом т.к. в существующих локалях zh_* уже есть все необходимое.
Comment 3 Yuri N. Sedunov 2023-11-16 22:33:38 MSK
Это тоже не надо?

предупреждение: Installed (but unpackaged) file(s) found:
    /usr/share/locale/zh_Hant/LC_MESSAGES/dialect.mo

https://www.localeplanet.com/icu/zh-Hant/index.html
Comment 4 gosts 87 2024-02-05 21:11:51 MSK
Извините, что встреваю.
В китайском есть разграничение не только по написанию иероглифов (упрощённые и традиционные), но и по странам.
В данном случае zh-Hans - это обозначение китайского упрощённого без привязки к какой-либо стране, zh-Hant - обозначение китайского традиционного без привязки к какой-либо стране.
В большинстве случаев китайскую локаль так не указывают.
Есть: 
zh_CN - китайский упрощённый (Китай),
zh_TW - китайский традиционный (Тайвань),
zh_HK - китайский (Гонконг),
zh_SG - китайский упрощённый (Сингапур),
zh_MO - китайский (Макао)
Но можно встретить и такой вариант обозначения китайского:
zh_Hant_MO - китайский традиционный (Макао),
zh_Hans_MO - китайский упрощённый (Макао),
zh_Hant_HK - китайский традиционный (Гонконг),
zh_Hans_HK - китайский упрощённый (Гонконг).
Т.е. в данном случае: "Hant" и "Hans" - это, скорее, - обозначение диалекта и того, какие иероглифы при написании используются (традиционные и упрощённые - соответственно), а не обозначение локали.
Comment 6 gosts 87 2024-04-06 22:04:50 MSK
"zh_CN Китайский, Китай. zh-Hans Упрощенный китайский. Первоначально данное обозначение возникло из языковых настроек в операционной системе. Спецификацией именования является языковой регион, например en_US (английский, Соединенные Штаты).Этот метод записи может игнорировать регионы без учета регионов, таких как: zh (китайский), en (английский).Позже было обнаружено, что один и тот же китайский язык также используется в разных регионах. Например, zh_CN, zh_SG (китайский-сингапурский), zh_CN и zh-SG используют один и тот же упрощенный китайский в разных регионах, поэтому описание не является строгим. Если оно записывается просто как zh, то невозможно отличить упрощенное от традиционного. Таким образом, новая спецификация используется для описания региона китайского языка zh-hans-CN Упрощенный китайский, Китай, zh-hans-SG Упрощенный китайский ( Сингапур), zh-hant-HK - традиционный китайский язык, Гонконг. Вы можете сокращать, когда вам не нужно описывать регион. Обе аббревиатуры - zh-hans, что означает упрощенный китайский. Английский язык по-прежнему выражается в en-US.В настоящее время только система win10 и браузер Edge поддерживают метод записи zh-hans.Как старая операционная система, так и современные основные браузеры используют zh, zh_CN для обозначения упрощенного китайского языка и zh_TW для обозначения традиционного китайского."
https://www.zhihu.com/question/21980689?utm_id=0
Comment 7 gosts 87 2024-04-06 22:18:36 MSK
Проще говоря, для обозначения китайского упрощённого в материковом Китае Hans или Hant не требуется (достаточно указать: zh или zh_CN).
Для обозначения Китайского упрощённого в Сингапуре - Hans или Hant - также не требуется (достаточно указать:zh_SG)
Для указания китайского в Гонконге и Макао это может потребоваться, потому-что в этих регионах используется как упрощённый китайский, так и традиционный.
В случае с упрощённым указывается zh-Hans-HK - для Гонконга и zh-Hans-MO - для Макао.
В случае с традиционным указывается zh-Hant-HK - для Гонконга и zh-Hant-MO - для Макао.
Указывать просто: zh-Hans и zh-Hant не имеет практического смысла, потому-что это соответствует старым-добрымиобозначениям: zh_CN и zh_TW - соответственно.
Comment 8 gosts 87 2024-04-06 22:21:23 MSK
На Тайване используется только китайский традиционный, поэтому достаточно обозначить его как: zh_TW.
Comment 9 gosts 87 2024-07-22 22:17:06 MSK
Итак. В дистрибутивах ALT используются следующие локали, относящиеся к китайскому языку:
zh - китайский упрощённый,
zh_CN - китайский упрощённый (Китай),
zh_SG - китайский упрощённый (Сингапур)
zh_TW - китайский традиционный (Тайвань),
zh_HK - китайский традиционный (Гонконг),
Фактически, локали zh и zh_CN дублируют друг-друга, потому-что в них используется один и тот-же вариант письма - упрощённые иероглифы.
В случае с zh_SG есть кое-какие нюансы.
В случае с zh_TW и zh_HK - тоже есть нюансы. Но поскольку в Альте локаль zh_HK - это только традиционный китайский, то никаких Hant и Hans не требуется. 
Вот если-бы гонконгских локалей в дистрибутиве было две (китайский традиционный и китайский упрощённый), то в таком случае разделение путём указывания локали "zh_Hant_HK" и "zh_Hans_HK" было-бы необходимо.