Discussion:
Représentation univoque?????
(trop ancien pour répondre)
Tamara
2005-06-21 22:08:25 UTC
Permalink
Bonjour,

Je viens de jeter un coup d'œil à la dernière version d'Unicode (attention,
peinture très fraîche!) et il y a un petit détail qui me turlupine.

À la page "Math Alphanumeric Symbols"
(http://www.unicode.org/charts/PDF/U1D400.pdf) pour la VO, ou "Symboles
mathématiques alphanumériques
(http://www.unicode.org/charts/fr/PDF/U40F-1D400.pdf) pour la VF, dans la
section "Script symbols" (Symboles de ronde), je lis: "Several script
symbols have been previously coded in the Letterlike Symbols block and are
retained there to ensure unambiguous representation" (Plusieurs symboles de
ronde (ou d'anglaise) ont déjà été codés dans le bloc des symboles de type
lettre, ils ne sont pas repris ici afin d'assurer une représentation
univoque.)

Pour les symboles qui n'ont pas été repris, ont trouve le mot "<reserved>"
(<réservé>) au point de code correspondant, ainsi qu'un renvoi vers le
caractère idoine.

Et pourtant, au caractère U+1D4C1, je lis MATHEMATICAL SCRIPT SMALL L /
MINUSCULE MATHÉMATIQUE L DE RONDE, je vois le dessin du caractère
correspondant, et en plus de ça, je vois un renvoi vers U+2113 SCRIPT SMALL
L / MINUSCULE L DE RONDE.

Je collecte les données nécessaires à la création d'un pilote de clavier
assez complet, et j'envisage d'y ajouter les symboles mathématiques
alphanumériques.
Pour le l minuscule de ronde, faudrait-il utiliser U+1D4C1 ou U+2113, et
pourquoi?
Faudrait-il réserver U+2113 pour le symbole du litre et utiliser U+1D4C1
dans tous les autres cas?

Merci

Tamara
Andreas Prilop
2005-06-22 15:03:56 UTC
Permalink
Post by Tamara
Pour le l minuscule de ronde, faudrait-il utiliser U+1D4C1 ou U+2113, et
pourquoi?
Faudrait-il réserver U+2113 pour le symbole du litre et utiliser U+1D4C1
dans tous les autres cas?
U+2113 is for compatibility with older character sets (e.g. cp949)
that had a special "l" for litre. You should not use this character
at all. The preferred symbols for litre are "L" and "l".
http://www.cs.tut.fi/~jkorpela/chars/si.html

Use U+1D4C1 in a mathematical context.
Tamara
2005-06-22 18:00:16 UTC
Permalink
Post by Andreas Prilop
Post by Tamara
Pour le l minuscule de ronde, faudrait-il utiliser U+1D4C1 ou U+2113, et
pourquoi?
Faudrait-il réserver U+2113 pour le symbole du litre et utiliser U+1D4C1
dans tous les autres cas?
U+2113 is for compatibility with older character sets (e.g. cp949)
that had a special "l" for litre. You should not use this character
at all. The preferred symbols for litre are "L" and "l".
http://www.cs.tut.fi/~jkorpela/chars/si.html
Use U+1D4C1 in a mathematical context.
Thank you, I see.
But since both characters share the same glyph, why didn't they simply write
"<reserved>" beside the character U+1D4C1 and use U+2113 for the math script
small l as they did for other characters? Are there other character sets
where both characters occur simultaneously? Anyway, that's not the case in
the cp949 character set
(http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP949.TXT).

Merci, je vois.
Mais puisque les deux caractères partagent le même glyphe, pourquoi n'a-t-on
pas simplement écrit "<réservé>" à côté du caractère U+1D4C1 et utilisé
U+2113 pour la minuscule mathématique l de ronde? Y a-t-il d'autres jeux de
caractères qui contiennent simultanément les deux caractères? En tout cas,
ce n'est pas le cas du jeu de caractères cp949
(http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP949.TXT).
Antoine Leca
2005-06-23 11:27:26 UTC
Permalink
Post by Tamara
Mais puisque les deux caractères partagent le même glyphe,
Je ne pense pas que ce soit obligatoire. Par exemple, une police chinoise a
de fortes chances d'avoir un carré pour U+1D4C1; et inversement une police à
utilisation mathématique pourrait avoir un carré pour U+2113. Etc.
Post by Tamara
pourquoi n'a-t-on pas simplement écrit "<réservé>" à côté du caractère
U+1D4C1 et utilisé U+2113 pour la minuscule mathématique l de ronde?
Certains (tous ?) algorithmes de compression Unicode s'appuient sur le fait
que les caractères « qui vont ensemble » ont des codes numériquement proches
(et oui, je sais parfaitement qu'il y a de multiples exceptions, c'est juste
un principe général).
Partant de ce principe, il n'est pas logique de situer un codet pour un
symbole mathématique dans une zone destinée à des symboles de compatibilité.
Post by Tamara
Y a-t-il d'autres jeux de caractères qui contiennent simultanément
les deux caractères?
Unicode ?
Plaisanterie à part, comme les caractères mathématiques sont relativement
récents, probablement pas encore. Mais les jeux chinois pouvant facilement
encoder de nombreux caractères, il n'est pas impossible qu'une prochaine
révision/extension d'un de ces standards « exhaustifs » contiennent les deux
caractères (en plus, probablement par inattention ou pour accomoder des
compatibilités ascendantes, ils encoderont probablement les deux...)


Antoine
Tamara
2005-06-24 19:33:53 UTC
Permalink
Post by Antoine Leca
Post by Tamara
Mais puisque les deux caractères partagent le même glyphe,
Je ne pense pas que ce soit obligatoire. Par exemple, une police chinoise a
de fortes chances d'avoir un carré pour U+1D4C1; et inversement une police à
utilisation mathématique pourrait avoir un carré pour U+2113. Etc.
D'accord. Je voulais simplement dire que le dessin des deux caractères me
semble identique. En tout cas, s'il y a une nuance, elle m'échappe
totalement.
Post by Antoine Leca
Post by Tamara
pourquoi n'a-t-on pas simplement écrit "<réservé>" à côté du caractère
U+1D4C1 et utilisé U+2113 pour la minuscule mathématique l de ronde?
Certains (tous ?) algorithmes de compression Unicode s'appuient sur le fait
que les caractères « qui vont ensemble » ont des codes numériquement proches
(et oui, je sais parfaitement qu'il y a de multiples exceptions, c'est juste
un principe général).
Partant de ce principe, il n'est pas logique de situer un codet pour un
symbole mathématique dans une zone destinée à des symboles de compatibilité.
D'un autre côté, les symboles mathématiques étant rarement utilisés seuls
mais plutôt mélangés à du texte normal, leur localisation dans le jeu de
caractère n'importe pas beaucoup.
Post by Antoine Leca
Post by Tamara
Y a-t-il d'autres jeux de caractères qui contiennent simultanément
les deux caractères?
Unicode ?
Évidemment.
Comme je n'ai pas trouvé U+1D4C1 dans la cp949, je demandais si, exception
faite d'Unicode, il existe des codages qui distinguent les deux caractères.
Post by Antoine Leca
Plaisanterie à part, comme les caractères mathématiques sont relativement
récents, probablement pas encore. Mais les jeux chinois pouvant facilement
encoder de nombreux caractères, il n'est pas impossible qu'une prochaine
révision/extension d'un de ces standards « exhaustifs » contiennent les deux
caractères (en plus, probablement par inattention ou pour accomoder des
compatibilités ascendantes, ils encoderont probablement les deux...)
Antoine
Continuer la lecture sur narkive:
Loading...