Discussion:
Enigme [Fut: Onglets CSS - version 11]
(trop ancien pour répondre)
Olivier Miakinen
2005-08-30 18:01:28 UTC
Permalink
/*
*
* .u0000 : U+0000..U+007F Basic Latin
* .u0080 : U+0080..U+00FF Latin-1 Supplement
* .u0100 : U+0100..U+017F Latin Extended-A
[...]
Est-ce que ces "range" correspondent à la notion de script en Unicode ?
Ce serait plutôt la notion de "charts", même s'il y en a pour ce qu'ils
appellent "scripts" : <http://www.unicode.org/charts/index.html>
mais il y a les mêmes pour les symboles et ponctuations :
<http://www.unicode.org/charts/symbols.html>.

Je fais suivre vers fr.comp.normes.unicode pour en savoir un peu plus
sur cette notion de scripts.
Antoine Leca
2005-08-31 09:41:04 UTC
Permalink
Post by Olivier Miakinen
/*
*
* .u0000 : U+0000..U+007F Basic Latin
* .u0080 : U+0080..U+00FF Latin-1 Supplement
* .u0100 : U+0100..U+017F Latin Extended-A
[...]
Est-ce que ces "range" correspondent à la notion de script en Unicode ?
Ce serait plutôt la notion de "charts",
Le terme correct est bloc http://hapax.qc.ca/glossaire.htm#bloc, "block" en
anglais (http://hapax.qc.ca/lexique.htm). Cf. le début du chapitre 16 (dans
la numérotation de la v4). Malheureusement Patrick n'a pas mis en ligne la
traduction française de ce texte.

Ni "range" ni "chart" ne font partie du lexique.

Les "scripts" sont les écritures, qui représentent une notion plus diffuse.
Tous les blocs ci-dessus servent pour l'écriture latine. Mais le bloc
0370..03FF sert (en v4) pour les écritures grecque et copte.



Antoine
Pierre Goiffon
2005-08-31 13:59:37 UTC
Permalink
Post by Antoine Leca
Post by Olivier Miakinen
*
* .u0000 : U+0000..U+007F Basic Latin
* .u0080 : U+0080..U+00FF Latin-1 Supplement
* .u0100 : U+0100..U+017F Latin Extended-A
[...]
Est-ce que ces "range" correspondent à la notion de script en Unicode ?
Ce serait plutôt la notion de "charts",
Le terme correct est bloc http://hapax.qc.ca/glossaire.htm#bloc,
(...)
Post by Antoine Leca
Ni "range" ni "chart" ne font partie du lexique.
Les "scripts" sont les écritures, qui représentent une notion plus diffuse.
Merci de votre réponse Antoine !
Malgrés les références que vous avez donné, j'ai un peu de mal à saisir
les différentes notions, je viens d'aller faire un tour sur le glossaire
du standard... qui ne m'a pas bcp plus avancé :/
http://www.unicode.org/glossary/#B
http://www.unicode.org/glossary/#S

Mais visiblement tel que je le comprend, c'est une question de hiérarchie ?
On a le répertoire de caractères, suivi des scripts, suivi des blocs ?
Antoine Leca
2005-09-01 09:29:56 UTC
Permalink
Post by Pierre Goiffon
Post by Antoine Leca
Les "scripts" sont les écritures, qui représentent une notion plus diffuse.
Mais visiblement tel que je le comprend, c'est une question de
hiérarchie ? On a le répertoire de caractères, suivi des scripts,
suivi des blocs ?
Non (à mon avis).
On a effectivement une hiérarchie entre le répertoire divisé en blocs,
eux-mêmes constitués de (normalement une seule, sauf erreur historique)
"range", qui est constituée de plusieurs colones (tous les chiffres
hexadécimaux sauf le dernier identiques, c'est l'unité d'allocation des
codes).

Les écritures sont une autre notion, différente et liée à la réalité (d'où
le « diffuse » ci-desssus), pas au processus de normalisation Unicode.
Ainsi, définir si l'écriture grecque et la copte forment un ensemble ou pas
est un débat d'experts. Une fois ce débat tranché (ce qui ne veut pas dire
résolu), peut-être que le bloc actuel sera découpé en deux (en fait, l'on
créera probablement un nouveau bloc avec de nouveaux caractères pour le
copte, si j'ai bien suivi).


Antoine
Pierre Goiffon
2005-09-02 08:52:22 UTC
Permalink
Post by Antoine Leca
Post by Pierre Goiffon
Mais visiblement tel que je le comprend, c'est une question de
hiérarchie ? On a le répertoire de caractères, suivi des scripts,
suivi des blocs ?
Non (à mon avis).
On a effectivement une hiérarchie entre le répertoire divisé en blocs,
eux-mêmes constitués de (normalement une seule, sauf erreur historique)
"range", qui est constituée de plusieurs colones (tous les chiffres
hexadécimaux sauf le dernier identiques, c'est l'unité d'allocation des
codes).
Les écritures sont une autre notion, différente et liée à la réalité (d'où
le « diffuse » ci-desssus), pas au processus de normalisation Unicode.
Merci de cette réponse
Je viens de lire ceci :
"The Unicode character code charts are divided into character blocks,
such that many scripts require the use of several blocks."
(source http://www.unicode.org/charts/About.html)
Sui semble totalement conforter cette idée !

Loading...