Discussion:
iso 15924 - codes pour les noms d'écritures
(trop ancien pour répondre)
Jean-Marc Desperrier
2005-01-05 10:25:43 UTC
Permalink
Salut,

Je suis tombé sur un truc que je connaissais pas, et je souhaite en
parler un peu ici, car c'est étroitement liés à l'utilisation d'unicode
sur le web, où il est indispensable d'indiquer systématiquement la
langue du texte.

Il s'agit de la norme assez récente ISO 15924, il s'agit en fait de
créer une manière normalisée de désigner les noms d'écritures.

En fait, l'intérêt de cette norme est surtout par rapport à une idée qui
commence à ce répandre dans les tag "lang" de pouvoir indiquer non
seulement la langue avec un code ISO 639, mais aussi l'écriture utilisée
pour la transcrire.

Ceci est utile par exemple quand le texte est représenté non dans son
écriture d'origine, mais en transcription latine, et aussi pour le
chinois pour préciser s'il faut utiliser les caractères traditionnels ou
simplifiés sans rentrer dans des considérations politiques en utilisants
zh-CN ou bien zh-TW.
On notera alors par exemple az-Latn (azerbadjian noté en transcription
latine), ou bien alors zh-Hans (chinois Han s-implifié) et zh-Hant
(chinois Han t-raditionnel).

En fait, il n'est toujours pas officiellement possible de coller
n'importe quel code ISO 15924 derrière un code ISO 639 pour obtenir un
tag lang valide, mais un certain de cas correspondant à ce modèle ont
déjà été enregistré spécifiquement (dont ceux cités au-dessus).

Références :

Codes pour la représentation des noms d’écritures
http://www.unicode.org/iso15924/iso15924-codes.html

ISO-639-2 :
http://www.loc.gov/standards/iso639-2/

Code lang enregistrés pour ajout à RFC3066 bis.
http://www.evertype.com/standards/iso639/iana-lang-assignments.html

Conseils sur l'utilisation du code lang sur les pages HTML/XHTML (y
compris sur l'utilisation avec les styles CSS) :
http://www.w3.org/International/tutorials/tutorial-lang/#specifying

Quelques infos similaires, mais éventuellement plus détaillées
directement sur les pages de l'auteur de la page précédente :
http://people.w3.org/rishida/articles/lang-and-cjk-font.html
http://www.w3.org/International/tutorials/tutorial-lang/#specifying
Jean-Marc Desperrier
2005-01-05 12:55:45 UTC
Permalink
Je complète :
http://users.adelphia.net/~dewell/rfc3066bis-codes.html
http://xml.coverpages.org/ni2003-11-14-a.html
user user
2005-01-22 21:04:38 UTC
Permalink
Post by Jean-Marc Desperrier
Salut,
Je suis tombé sur un truc que je connaissais pas, et je souhaite en
parler un peu ici, car c'est étroitement liés à l'utilisation d'unicode
sur le web, où il est indispensable d'indiquer systématiquement la
langue du texte.
Il s'agit de la norme assez récente ISO 15924, il s'agit en fait de
créer une manière normalisée de désigner les noms d'écritures.
En fait, l'intérêt de cette norme est surtout par rapport à une idée qui
commence à ce répandre dans les tag "lang" de pouvoir indiquer non
seulement la langue avec un code ISO 639, mais aussi l'écriture utilisée
pour la transcrire.
Ceci est utile par exemple quand le texte est représenté non dans son
écriture d'origine, mais en transcription latine, et aussi pour le
chinois pour préciser s'il faut utiliser les caractères traditionnels ou
simplifiés sans rentrer dans des considérations politiques en utilisants
zh-CN ou bien zh-TW.
On notera alors par exemple az-Latn (azerbadjian noté en transcription
latine), ou bien alors zh-Hans (chinois Han s-implifié) et zh-Hant
(chinois Han t-raditionnel).
En fait, il n'est toujours pas officiellement possible de coller
n'importe quel code ISO 15924 derrière un code ISO 639 pour obtenir un
tag lang valide, mais un certain de cas correspondant à ce modèle ont
déjà été enregistré spécifiquement (dont ceux cités au-dessus).
Codes pour la représentation des noms d’écritures
http://www.unicode.org/iso15924/iso15924-codes.html
http://www.loc.gov/standards/iso639-2/
Code lang enregistrés pour ajout à RFC3066 bis.
http://www.evertype.com/standards/iso639/iana-lang-assignments.html
Conseils sur l'utilisation du code lang sur les pages HTML/XHTML (y
http://www.w3.org/International/tutorials/tutorial-lang/#specifying
Quelques infos similaires, mais éventuellement plus détaillées
http://people.w3.org/rishida/articles/lang-and-cjk-font.html
http://www.w3.org/International/tutorials/tutorial-lang/#specifying
Nicolas Krebs
2005-02-06 10:23:58 UTC
Permalink
Bonjour,

Jean-Marc Desperrier �crivit dans l'article news:crge36$occ$***@reader1.imaginet.fr
du 05 janvier 2005
Post by Jean-Marc Desperrier
Salut,
Je suis tombé sur un truc que je connaissais pas,
Moi aussi, il y a plusieurs mois.
Post by Jean-Marc Desperrier
et je souhaite en
parler un peu ici, car c'est étroitement liés à l'utilisation d'unicode
D'ailleurs http://www.unicode.org/iso15924/codelists.html montre comment
beaucoup de codes ISO 15924 correspondent à un code « Property Value
Alias » de unicode (c'est le nom des sections
http://www.unicode.org/Public/UNIDATA/Blocks.txt ?).
Post by Jean-Marc Desperrier
sur le web, où il est indispensable d'indiquer systématiquement la
langue du texte.
Il s'agit de la norme assez récente ISO 15924, il s'agit en fait de
créer une manière normalisée de désigner les noms d'écritures.
En fait, l'intérêt de cette norme est surtout par rapport à une idée qui
commence à ce répandre dans les tag "lang" de pouvoir indiquer non
seulement la langue avec un code ISO 639, mais aussi l'écriture utilisée
pour la transcrire.
Ceci est utile par exemple quand le texte est représenté non dans son
écriture d'origine, mais en transcription latine, et aussi pour le
chinois pour préciser s'il faut utiliser les caractères traditionnels ou
simplifiés sans rentrer dans des considérations politiques en utilisants
zh-CN ou bien zh-TW.
On notera alors par exemple az-Latn (azerbadjian noté en transcription
latine), ou bien alors zh-Hans (chinois Han s-implifié) et zh-Hant
(chinois Han t-raditionnel).
(zh-Hans date de plus d'un an et demi
http://www.iana.org/assignments/lang-tags/zh-Hans )
Post by Jean-Marc Desperrier
En fait, il n'est toujours pas officiellement possible de coller
n'importe quel code ISO 15924 derrière un code ISO 639 pour obtenir un
tag lang valide, mais un certain de cas correspondant à ce modèle ont
déjà été enregistré spécifiquement (dont ceux cités au-dessus).
Là, vous ne décrivez pas la seule liste ISO 15924, l'usage isolé des
codes ISO 15924, mais un usage de ces codes dans des codes de langues.
(entre autres remarques)
Il s'agit plus qu'une simple pratique de certaines personnes.
C'est actuellement un projet pour remplacer, succéder, la norme rfc 3066
( http://www.ietf.org/rfc/rfc3066.txt ).
Cependant je ne peux pas en recommander l'usage car ce n'est pas encore
officiel.
Post by Jean-Marc Desperrier
Codes pour la représentation des noms d’écritures
http://www.unicode.org/iso15924/iso15924-codes.html
http://www.loc.gov/standards/iso639-2/
Code lang enregistrés pour ajout à RFC3066 bis.
http://www.evertype.com/standards/iso639/iana-lang-assignments.html
Conseils sur l'utilisation du code lang sur les pages HTML/XHTML (y
http://www.w3.org/International/tutorials/tutorial-lang/#specifying
Vous n'avez pas signalés :
- en haut à droite de http://users.adelphia.net/~dewell/
« Language tagging

* Draft version 8 of "RFC 3066bis"[
http://www.inter-locale.com/ID/draft-phillips-langtags-08.html]
* text version [
http://www.ietf.org/internet-drafts/draft-phillips-langtags-08.txt] »
(que vous auriez pu remarquer)
- http://www.inter-locale.com/ID/draft-phillips-langtags-09.html
(version du 26 janvier 2005)
- http://www.inter-locale.com/ID/why-rfc3066bis.html
- http://www.unicode.org/iso15924/
- http://www.iana.org/assignments/language-tags
Nicolas Krebs
2005-07-19 19:52:46 UTC
Permalink
Nicolas Krebs �crivit dans l'article news:4205f02d$0$19438$***@news.wanadoo.fr
du 2005-02-06 (6 février 2005)
Post by Nicolas Krebs
Il
[ne]
Post by Nicolas Krebs
s'agit plus
[que de http://www.iana.org/assignments/language-tags ]
Post by Nicolas Krebs
C'est
[Il y a]
Post by Nicolas Krebs
actuellement un projet pour remplacer, succéder, la norme rfc 3066
Voir http://www.ietf.org/html.charters/ltru-charter.html et
« Just a reminder that the WG last calls on our drafts end July 28.
http://www.ietf.org/internet-drafts/draft-ietf-ltru-registry-09.txt
http://www.ietf.org/internet-drafts/draft-ietf-ltru-initial-02.txt

I'd like to thank all those who have taken the time to review these
documents
and submit comments. Comments are still welcome »
( http://www1.ietf.org/mail-archive/web/ltru/current/msg02972.html )
Nicolas Krebs
2006-09-09 22:39:59 UTC
Permalink
Hier ont été publiés trois RFC.

RFC 4646
Tags for Identifying Languages
urn:ietf:rfc:4646
http://www.ietf.org/rfc/rfc4646.txt

RFC 4645
Initial Language Subtag Registry
urn:ietf:rfc:4645
http://www.ietf.org/rfc/rfc4645.txt

Language Subtag Registry
http://www.iana.org/assignments/language-subtag-registry

Par rapport à la RFC 3066, le format ajoute de manière générique les codes
Par exemple le code zh-Hant désigne du chinois écrit en idéogrammes
chinois en variante traditionnelle (déjà valide
http://www.iana.org/assignments/lang-tags/zh-Hant ), et le code und-Lina
désigne une écriture inconnue écrite en linéaire A.

Les inconditionnels de Adams Douglas pourront remarquer le nombre 42 dans
la section 4.3.1.

Liée à urn:ietf:bcp:47, la troisième rfc :
RFC 4647
Matching of Language Tags
urn:ietf:rfc:4647
http://www.ietf.org/rfc/rfc4647.txt
Nicolas Krebs
2006-09-12 22:02:43 UTC
Permalink
Post by Nicolas Krebs
RFC 4646
Tags for Identifying Languages
urn:ietf:rfc:4646
http://www.ietf.org/rfc/rfc4646.txt
RFC 4645
Initial Language Subtag Registry
urn:ietf:rfc:4645
http://www.ietf.org/rfc/rfc4645.txt
Language Subtag Registry
http://www.iana.org/assignments/language-subtag-registry
Voir les articles de
- Stéphane Bortzmeyer, « RFC 4646: Tags for Identifying Languages »,
bortzmeyer.org, 11 septembre 2006, http://www.bortzmeyer.org/4646.html
- Stéphane Bortzmeyer, « RFC 4645: Initial Language Subtag Registry »,
bortzmeyer.org, 11 septembre 2006, http://www.bortzmeyer.org/4645.html

et éventuellement, en anglais,
- W3C Internationalization Activity, « RFC 3066 Tags for Identifying
Languages superseded », 11 septembre 2006,
http://www.w3.org/blog/International/2006/09/11/rfc_3066_tags_for_identifying_languages_
- Reasons for Enhancing RFC 3066,
http://www.inter-locale.com/ID/why-rfc3066bis.html
- Addison Phillips, « Understanding the New Language Tags », dans W3C
Internationalization Activity, http://www.w3.org/International/articles/bcp47/
- Deborah Cawkwell, « FAQ: Why use the language attribute? », dans W3C
Internationalization Activity, http://www.w3.org/International/questions/qa-lang-why
Nicolas Krebs
2006-12-13 18:24:50 UTC
Permalink
Je me permets de vous signaler une modification des possibilité
d'étiquetage linguistique sous le régime de la rfc 4646 (qui s'applique
aux en-tête « Content-Language: »), auquel a été ajouté la possibilité
d'utiliser « el-monoton » et « el-polyton » pour désigner respectivement
le grec moderne en écriture monotonique et le grec moderne en écriture
polytonique.

Pour rappel, « grc » et « el » correspondent (sous le régime de la rfc
4646) respectivement au grec ancien et au grec moderne, et
« Content-Language: fr, el » dans des en-tête signifie que le contenu est
en français moderne et en grec moderne.
Nicolas Krebs
2007-03-20 20:33:07 UTC
Permalink
Bonjour,

J'aimerai savoir si vous avez une quelconque objection à ce qu'un organisme
international enregistre des codes d'étiquetage linguistique (1)
pour respectivement « Late Middle French » (moyen français tardif ?) et
« Early Modern French » (français moderne précoce ?), correspondant
au livre de 1606 « Thresor de la Langue Françoyse » (2) et au livre
de 1694 « Dictionnaire de l'académe françoise » (3) .

Note : toute objection doit être émise dans les jours qui viennent.

1 : sous le régime de la rfc 4646
2 : http://www.alvestrand.no/pipermail/ietf-languages/2007-March/006113.html
3 : http://www.alvestrand.no/pipermail/ietf-languages/2007-March/006115.html
Nicolas Krebs
2007-03-23 18:51:26 UTC
Permalink
Post by Nicolas Krebs
Bonjour,
J'aimerai savoir si vous avez une quelconque objection à ce qu'un organisme
international enregistre des codes d'étiquetage linguistique (1)
pour respectivement « Late Middle French » (moyen français tardif ?) et
« Early Modern French » (français moderne précoce ?), correspondant
au livre de 1606 « Thresor de la Langue Françoyse » (2) et au livre
de 1694 « Dictionnaire de l'académe françoise » (3) .
Note : toute objection doit être émise dans les jours qui viennent.
1 : sous le régime de la rfc 4646
2 : http://www.alvestrand.no/pipermail/ietf-languages/2007-March/006113.html
3 : http://www.alvestrand.no/pipermail/ietf-languages/2007-March/006115.html
Ça y est, c'est enregistré.
http://www.iana.org/assignments/language-subtag-registry
Nicolas Krebs
2007-03-23 20:44:50 UTC
Permalink
Post by Nicolas Krebs
Bonjour,
J'aimerai savoir si vous avez une quelconque objection à ce qu'un organisme
international enregistre des codes d'étiquetage linguistique (1)
pour respectivement « Late Middle French » (moyen français tardif ?) et
« Early Modern French » (français moderne précoce ?), correspondant
au livre de 1606 « Thresor de la Langue Françoyse » (2) et au livre
de 1694 « Dictionnaire de l'académe françoise » (3) .
Note : toute objection doit être émise dans les jours qui viennent.
1 : sous le régime de la rfc 4646
2 : http://www.alvestrand.no/pipermail/ietf-languages/2007-March/006113.html
3 : http://www.alvestrand.no/pipermail/ietf-languages/2007-March/006115.html
Puisqu'il n'y a pas eu d'objection, cela a été enregistré.
Codes « frm-1606nict » et « fr-1694acad », référencés dans
http://www.iana.org/assignments/language-subtag-registry .

Loading...