Xavier Roche
2008-02-18 20:41:48 UTC
Oulah, là on est vraiment HS sur frc..
étant "le" système attibuant un numéro unique aux caractères (latin,
arabe, chinois, etc.)
Hop, petit topo:
<http://www.unicode.org/standard/translations/french.html>
usités. Quel système d'exploitation ne reconnait pas Unicode, à l'heure
actuelle ? Même en retournant dix ans en arrière, je ne vois pas..
système. C'est une suite d'octets 8 bit parfaitement normalisée, non
redondante, non changeante, et compatible avec l'ASCII.
Il se *peut* que certains logiciels aient du mal avec la représentation
en UCS-2 sur deux octets (variantes "petit boutien" et "grand boutien")
si cette dernière n'est pas préfixée par un marqueur de début (0xfeff),
mais il est rare de voir de l'UCS2 circuler (on préfère l'UTF-8, qui a
l'avantage d'être naturellement compatible avec l'ascii)
infernal qui suppose d'avoir autant de systèmes d'encodage que de types
de caractères, avec des cas extrèmes (le Chinois/Japonais/Coréen qui
utilisent des caractères communs, mais qui se trouvaient encodés de
manière totalement différente selon les cas: BIG5, Shift-Jis, les
infâmes ISO-2022-* (beurk) etc.)
Unicode (et UTF-8, son encodage "naturel" pour du réseau et du stockage)
est le seul système à pouvoir (enfin) s'affranchir une bonne fois pour
toutes des problèmes de caractères.
(FU2 fr.comp.normes.unicode parce que c'est _vraimet_ HS ici)
L'UTF-8 est semble-t-il une norme.
Une norme pour représenter ("encoder") des caractères Unicode. Unicodeétant "le" système attibuant un numéro unique aux caractères (latin,
arabe, chinois, etc.)
Hop, petit topo:
<http://www.unicode.org/standard/translations/french.html>
L'ISO 8859-1 ou -14 (Euro) est une norme.
Qui deviennent de plus en plus obsolète.L'UTF-8 couvre plus de caractères que l'ISO 8859-1 (langues
orientales...) mais est moins bien reconnu selon les machines et/ou les
systèmes d'exploitation.
Bof. Aujourd'hui il a tendance a être mieux reconnu que certains ISO peuorientales...) mais est moins bien reconnu selon les machines et/ou les
systèmes d'exploitation.
usités. Quel système d'exploitation ne reconnait pas Unicode, à l'heure
actuelle ? Même en retournant dix ans en arrière, je ne vois pas..
De l'UTF-8 envoyé par un PC sous windows et lu sur un Mac, ça donne du
vénusien septentrional très peu lisible.
Non non, impossible. La représentation UTF-8 est unique, quelque soit levénusien septentrional très peu lisible.
système. C'est une suite d'octets 8 bit parfaitement normalisée, non
redondante, non changeante, et compatible avec l'ASCII.
Il se *peut* que certains logiciels aient du mal avec la représentation
en UCS-2 sur deux octets (variantes "petit boutien" et "grand boutien")
si cette dernière n'est pas préfixée par un marqueur de début (0xfeff),
mais il est rare de voir de l'UCS2 circuler (on préfère l'UTF-8, qui a
l'avantage d'être naturellement compatible avec l'ascii)
L'ISO 8859-1 et dérivés permet de s'affranchir de toutes ces conversions
Non. Les "encodages" historiques représentent aujourd'hui un maelströminfernal qui suppose d'avoir autant de systèmes d'encodage que de types
de caractères, avec des cas extrèmes (le Chinois/Japonais/Coréen qui
utilisent des caractères communs, mais qui se trouvaient encodés de
manière totalement différente selon les cas: BIG5, Shift-Jis, les
infâmes ISO-2022-* (beurk) etc.)
Unicode (et UTF-8, son encodage "naturel" pour du réseau et du stockage)
est le seul système à pouvoir (enfin) s'affranchir une bonne fois pour
toutes des problèmes de caractères.
(FU2 fr.comp.normes.unicode parce que c'est _vraimet_ HS ici)