Discussion:
Unicode 5 en Pratique, utile, bien ficelé
(trop ancien pour répondre)
GTA VI
2008-05-06 15:50:27 UTC
Permalink
J'ai acheté par hasard Unicode 5 en Pratique de Mark Davis et Patrick
Andries.

J'ai bien aimé, ça m'a permis de corriger quelques pages qui marchaient
mal avec MSIE. Je comprends mieux aussi comment le mail fonctionne et
comment utiliser l'UTF8.

Certains sujets sont un peu compliqué, comme le tri français correct, va
falloir que je réfléchisse plus. Mais, en tous cas, c'est la première
fois que je vois le sujet important.

Autres trucs que j'ai bien aimés: la library ICU, bons exemples, comment
faire un site multilingue, du XML plus facile à traduire en plusieurs
langues, et comment fonctionne les polices OpenType en une vingatine de
pages sans se taper la brique indigeste (et déjà dépassée) de Haralabous.

Bref, je dirais que le livre est utile, bien ficelé, mais j'aurais voulu
en connaitre plus sur certains scripts et sur le fonctionnement sur Mac.
Une Bévue
2008-05-06 16:07:43 UTC
Permalink
Post by GTA VI
Certains sujets sont un peu compliqué, comme le tri français correct, va
falloir que je réfléchisse plus.
ce livre aborde t'il l'ordre "alphabétique" en français, je veux dire
l'ordre suivant la casse et incluant les lettres accentuées ?
--
Une Bévue
Antoine Leca
2008-05-14 12:50:02 UTC
Permalink
Post by Une Bévue
Post by GTA VI
Certains sujets sont un peu compliqué, comme le tri français
correct, va falloir que je réfléchisse plus.
ce livre aborde t'il l'ordre "alphabétique" en français, je veux dire
l'ordre suivant la casse et incluant les lettres accentuées ?
Il n'y a pas UN ordre « alphabétique » en français (le terme correct est «
lexicographique », l'ordre des dictionnaires), il y a plusieurs conventions,
plus ou moins complexes et plus ou moins suivies.

La plus connue (et pas la plus simple) veut que l'on suive l'ordre des
lettres dans l'alphabet (sans tenir compte des accents ou de la casse), puis
qu'en cas d'égalité l'on considère l'occurence d'accents en commençant par
la fin du mot : donc cote < côte < coté < côté < cotes ; ce que devrait
indiquer votre dictionnaire.
Si on veut plus fin on peut établir des règles pour distinguer entre les
différents accents ou en fonction de la casse, mais les dictionnaires ne
font pas ce genre de chi-chi.

Évidemment, cette règle n'est applicable que pour un mot pris isolément :
pas question donc de l'utiliser telle quelle pour traiter une expression ou
un morceau de texte : c'est pour cela que j'ai écrit plus haut qu'il n'y
avait pas unicité.


Antoine
Olivier Miakinen
2008-05-14 21:17:54 UTC
Permalink
Post by Antoine Leca
Il n'y a pas UN ordre « alphabétique » en français (le terme correct est «
lexicographique », l'ordre des dictionnaires), il y a plusieurs conventions,
plus ou moins complexes et plus ou moins suivies.
La plus connue (et pas la plus simple) veut que l'on suive l'ordre des
lettres dans l'alphabet (sans tenir compte des accents ou de la casse),
Oui.
Post by Antoine Leca
puis
qu'en cas d'égalité l'on considère l'occurence d'accents en commençant par
la fin du mot : donc cote < côte < coté < côté < cotes ; ce que devrait
indiquer votre dictionnaire.
Oh, je ne connaissais pas cette convention. C'est bien celle de mon
Petit Larousse, mais pas celle de mon Petit Robert ; ce dernier prend
en compte les accents en commençant par le début du mot : cote < coté
< côte < côté.
Post by Antoine Leca
[...]
pas question donc de l'utiliser telle quelle pour traiter une expression ou
un morceau de texte : c'est pour cela que j'ai écrit plus haut qu'il n'y
avait pas unicité.
Merci pour ces renseignements.
Une Bévue
2008-05-30 10:06:13 UTC
Permalink
Post by Antoine Leca
Il n'y a pas UN ordre « alphabétique » en français (le terme correct est «
lexicographique », l'ordre des dictionnaires), il y a plusieurs conventions,
plus ou moins complexes et plus ou moins suivies.
La plus connue (et pas la plus simple) veut que l'on suive l'ordre des
lettres dans l'alphabet (sans tenir compte des accents ou de la casse), puis
qu'en cas d'égalité l'on considère l'occurence d'accents en commençant par
la fin du mot : donc cote < côte < coté < côté < cotes ; ce que devrait
indiquer votre dictionnaire.
Si on veut plus fin on peut établir des règles pour distinguer entre les
différents accents ou en fonction de la casse, mais les dictionnaires ne
font pas ce genre de chi-chi.
pas question donc de l'utiliser telle quelle pour traiter une expression ou
un morceau de texte : c'est pour cela que j'ai écrit plus haut qu'il n'y
avait pas unicité.
OK, merci beaucoup pour cette réponse, pour info, j'ai pris la
convention suivante (code ruby):
"$char_order"" += %w[A À Á Â Ã Ä Å a à á â ã ä å]#(extrait pour le "a")


donc, dans le comparateur, au lieu de comparer le code d'un caractère,
je compare l'index du caractère dans ce tableau ordonné, à ma façon...

en commençant par le caractère le plus à gauche

et je gère les ligatures en les "déployant" par ex "æ" devient "ae"
--
Une Bévue
Jérémy JUST
2008-05-06 18:10:30 UTC
Permalink
On Tue, 06 May 2008 11:50:27 -0400
comment fonctionne les polices OpenType en une vingatine de pages sans
se taper la brique indigeste (et déjà dépassée) de Haralambous.
Si c'est effectivement une bien grosse brique, je ne suis pas sûr
qu'elle soit dépassée, car elle vient d'être traduite en anglais et
(re)publiée chez O'reilly (en septembre dernier).
--
Jérémy JUST <***@netcourrier.com>
Stephane Bortzmeyer
2008-06-16 19:53:35 UTC
Permalink
Post by GTA VI
J'ai acheté par hasard Unicode 5 en Pratique de Mark Davis et Patrick
Andries.
De Patrick Andries. Mark Davis a juste fait la préface.

http://www.bortzmeyer.org/unicode-en-pratique.html

Loading...