Discussion:
decomposition mapping
(trop ancien pour répondre)
Do Re Mi chel La Si Do
2005-06-30 12:48:28 UTC
Permalink
Bonjour !

Je viens encore troubler votre quiétude, avec une question de débutant.

Voilà : j'ai vu certains algorithmes "d'annulation des accents" qui
utilisent le "character decomposition mapping".

Cela donne le caractère de base, suivi des éventuels additifs/surcodages (je
n'ai pas le mot exact).

Je suppose, toutefois, que cette construction doit présenter moult
exceptions et limites.

Savez-vous où je pourrais trouver des informations, en français, sur le
"character decomposition mapping" ?

Merci d'avance.

@-salutations

Michel Claveau
Jean-Marc Desperrier
2005-06-30 22:20:53 UTC
Permalink
Post by Do Re Mi chel La Si Do
Voilà : j'ai vu certains algorithmes "d'annulation des accents" qui
utilisent le "character decomposition mapping".
Cela donne le caractère de base, suivi des éventuels additifs/surcodages (je
n'ai pas le mot exact).
Les accents sous forme de caractères combinants.
Post by Do Re Mi chel La Si Do
Je suppose, toutefois, que cette construction doit présenter moult
exceptions et limites.
C'est pas une question d'exceptions et limites, c'est que la seule
manière de le faire est d'utiliser une table de correspondance.

Ce qui signifie que si le but est "d'annuler les accents", il est plus
simple et plus rapide de travailler avec une table qui donne directement
et seulement le caractère de base.

Le truc peut-être est que l'on peut disposer en standard d'une fonction
unicode qui convertit en forme normalisé NFD + une fonction/table de
propriétés qui indique si un caractère est combinant, et donc passer par
cela plutôt que de rajouter une autre table pour le faire directement.
Post by Do Re Mi chel La Si Do
Savez-vous où je pourrais trouver des informations, en français, sur le
"character decomposition mapping" ?
Tu fouille sur le site d'unicode en français en particulier le chapitre 6 ?
http://hapax.qc.ca/

La table de référence qui donne les décompositions est la Unicode
Character Database, mais je crois que les info nécessaire sont présentes
aussi dans le fichier ici :
http://hapax.qc.ca/ListeDesNoms-4.0.0.txt

Loading...