Jean-Marc Desperrier
2004-02-06 14:35:57 UTC
Au fait, si quelqu'un ici doit un jour coder un truc qui décode de
l'UTF-8 ...
N'oubliez pas de vous référer au document suivant de Markus Kuhn :
http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt
qui teste tous les cas limite à bien gérer.
Comme celui-là par exemple d'après un commentaire de Markus Kuhn :
"A malformed UTF-8 sequence can *never* contain an ASCII
byte, because that ASCII byte is always terminating any malformed
sequence that might precede it. Any ASCII character must resynchronize
the decoder and will then be interpreted correctly as an ASCII
character."
l'UTF-8 ...
N'oubliez pas de vous référer au document suivant de Markus Kuhn :
http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt
qui teste tous les cas limite à bien gérer.
Comme celui-là par exemple d'après un commentaire de Markus Kuhn :
"A malformed UTF-8 sequence can *never* contain an ASCII
byte, because that ASCII byte is always terminating any malformed
sequence that might precede it. Any ASCII character must resynchronize
the decoder and will then be interpreted correctly as an ASCII
character."