Discussion:
Des divers formats de codage d'Unicode (olim: Test code)
(trop ancien pour répondre)
Denis Liégeois
2004-01-02 18:52:03 UTC
Permalink
Quel codage ? Unicode n'est *pas* un codage.
Cela aurait été bien que tu continue en disant ce que
c'est, ça m'aurait éviter de demander : c'est quoi,
alors ? :)
Laissez tomber, il a raison. En gros, c'est un jeu de
caractères, mais il y a plusieurs façons de le coder,
notamment pour le transmettre, mais même pas uniquement
pour ça. Par exemple, le format UTF-8, qui est certainement
le meilleur à utiliser dans ce contexte-ci, est également
celui qui est adopté sous Linux dans le système lui-même,
mais ce n'est pas celui qu'on retrouvera à l'intérieur d'un
système comme Windows (ou le MacOs, dont je présume qu'il
code en UCS aussi).

De toute façon, en pratique, quand quelque chose est
unicodisé, le problème ne se pose guère, parce que les
conversions d'un système de codage à l'autre sont
implantées dans des routines assez faciles et que c'est
transparent pour l'utilisateur.

[Copie et suivi dans le forum news:fr.comp.normes.unicode]
Nicolas Krebs
2004-01-02 18:55:51 UTC
Permalink
Bonjour,
Si nous nous plaçons de ce point de vue : UTF-8 est grosso modo
compatible avec l'iso-8859-1
Non, seule la partie ASCII sera compréhensible si elle est affichée
sans conversion. Ce qui n'est pas le cas entre l'ISO-8859-1, ISO-8859-15
et cp-1252 (il n'y a que quelques caractères qui diffèrent).
Pourtant, j'avais cru comprendre précédement que les 256 premiers
caractères de unicode, encodés en utf-8, peuvent être écrit de façon
identique, bit � bit, que de l'iso-8859-1 news:***@patrick.noorg ,
et que les logiciels pourraient le faire (et éviter les « é »).
Nicolas Krebs
2004-01-02 19:24:07 UTC
Permalink
Bonjour,
Post by Denis Liégeois
Erwan David
Quel codage ? Unicode n'est *pas* un codage.
Laissez tomber, il a raison. En gros, c'est un jeu de
caractères, mais il y a plusieurs façons de le coder,
Ah d'accord, E.D. faisait la distinction entre unicode, table de
caractère, et utf-8, (en)codage d'unicode.
Post by Denis Liégeois
notamment pour le transmettre, mais même pas uniquement
pour ça. Par exemple, le format UTF-8, qui est certainement
le meilleur à utiliser dans ce contexte-ci, est également
celui qui est adopté sous Linux dans le système lui-même,
mais ce n'est pas celui qu'on retrouvera à l'intérieur d'un
système comme Windows (ou le MacOs, dont je présume qu'il
code en UCS aussi).
Connaissez vous http://www.psydk.org/ar_2003-10.php#n41 ?
Post by Denis Liégeois
De toute façon, en pratique, quand quelque chose est
unicodisé,
codé => unicodé ?
Post by Denis Liégeois
le problème ne se pose guère, parce que les
conversions d'un système de codage à l'autre sont
implantées dans des routines assez faciles et que c'est
transparent pour l'utilisateur.
^^^^^^^^^^^
invisible
Denis Liégeois
2004-01-03 07:12:32 UTC
Permalink
Post by Nicolas Krebs
Ah d'accord, E.D. faisait la distinction entre
unicode, table de caractère, et utf-8, (en)codage
d'unicode.
Exactement.
Post by Nicolas Krebs
Connaissez vous http://www.psydk.org/ar_2003-10.php#n41 ?
Non, mais je ne vois pas très bien pourquoi vous renvoyez
à ça, si ce n'est que je suppose que ça a trait au
Macintosh. L'auteur de ces lignes dit qu'il s'est aligné
sur ce qui est le plus courant sous Windows. Je ne sais
pas au juste ce que fait le MacOS, mais dorénavant, les
routines équivalentes sont très certainement implantées
dans le système.

Il y a gros à parier pour que tout ce qui a été écrit avant
la dernière version du MacOS (X) ait intérêt à être revu et
recompilé, de toute façon, mais d'après ce que j'ai vu, chez
les fabricants des principaux logiciels, c'est déjà fait ou
c'est en cours.

Le dernier utilisateur qui m'a écrit pour me demander comment
faire pour ne pas perdre le grec à l'importation dans ses deux
logiciels de mise en page (professionnels), je lui ai bêtement
répondu de ne pas chercher des astuces et de mettre ces logiciels
à jour : les deux fabricants mettent précisément ça dans la liste
des améliorations apportées à la dernière version en liaison avec
les progrès du système d'exploitation.
Post by Nicolas Krebs
Post by Denis Liégeois
De toute façon, en pratique, quand quelque chose est
unicodisé,
codé => unicodé ?
Non, quand je dis « unicodisé », je veux parler d'un système
(ou d'un logiciel) qui se met, d'une façon ou d'une autre,
à gérer Unicode. Une routine telle que celle qui permet
la traduction entre UCS et UTF ou celles qui permettent la
récupération de données qui seraient encore dans les anciens
codages à 8 bits doit fatalement être fournie quelque part
et il n'est pas nécessaire que chaque programmeur s'amuse à
bourrer le système de la 42e version de la même routine sous
un nom différent.

Loading...