Discussion:
Lettres précomposées ou non (R avec macron)
(trop ancien pour répondre)
Julien ÉLIE
2010-12-06 20:31:16 UTC
Permalink
Bonjour,

Au cours d'une discussion cet après-midi, on me faisait part
qu'il n'existait pas de caractère Unicode « R » surmonté
d'un macron.
Je vois un macron (U+0304) à utiliser en combinaison : R̄.
Mais le résultat n'est pas toujours joli : la barre est
décentrée sur la lettre. Existe-t-il des techniques pour
pallier cela ?

Cette lettre serait utile au serbo-croate d'après ce que
j'ai compris.

Je me demande donc pourquoi certaines lettres précomposées
existent dans Unicode, et d'autres non... Car il existe
par exemple le Ṝ (U+1E5C) avec un point dessous, mais
pas cette même lettre sans le point.
Il aussi existe un Ḡ (U+1E20).

Bonne soirée et d'avance merci pour vos éventuels éclairages.
--
Julien ÉLIE

« Pour une personne optimiste, le verre est à moitié plein.
Pour une personne pessimiste, il est à moitié vide.
Pour l'informaticien, il est deux fois plus grand que nécessaire. »
Olivier Miakinen
2010-12-06 23:26:07 UTC
Permalink
Bonjour,

Remarque liminaire : je ne suis pas un spécialiste Unicode, aussi il est
possible que je raconte des bêtises. Ce qui suit est ce que je crois
avoir compris.
Post by Julien ÉLIE
Au cours d'une discussion cet après-midi, on me faisait part
qu'il n'existait pas de caractère Unicode « R » surmonté
d'un macron.
C'est possible en effet.
Post by Julien ÉLIE
Je vois un macron (U+0304) à utiliser en combinaison : R̄.
Mais le résultat n'est pas toujours joli : la barre est
décentrée sur la lettre.
C'est que la police que tu utilises n'a pas prévu de R avec macron.
Je ne pense pas que la présence ou l'absence de lettre précomposée
dans Unicode puisse améliorer les choses.
Post by Julien ÉLIE
Existe-t-il des techniques pour pallier cela ?
Possible, mais ce n'est pas mon rayon. Je passe.
Post by Julien ÉLIE
Cette lettre serait utile au serbo-croate d'après ce que
j'ai compris.
Pourtant, si vraiment il n'existe pas de R macron précomposé, alors je
pense que cela signifie que cette lettre n'existe dans aucun jeu de
caractères 8 bits normalisé. Je trouve ça étonnant pour une langue
européenne.

Dans ISO-8859-2, utilisé pour le croate, j'ai trouvé les lettres Ŕ et Ř
(ainsi que ŕ et ř) mais rien avec macron. Et pour le serbe c'est une
table cyrillique, ISO-8859-5.

Pour info, j'ai aussi trouvé ceci :
http://tlt.its.psu.edu/suggestions/international/bylanguage/serbocroatian.html
<cit.>
# Roman Alphabet Encodings: utf-8 (Unicode ), iso-8859-2 (Latin 2),
windows-1250
# Cyrillic Encodings: utf-8 (Unicode ), windows-1251
</cit.>

Le windows-1250 ne semble pas contenir de R macron non plus.
Post by Julien ÉLIE
Je me demande donc pourquoi certaines lettres précomposées
existent dans Unicode, et d'autres non... Car il existe
par exemple le Ṝ (U+1E5C) avec un point dessous, mais
pas cette même lettre sans le point.
Il aussi existe un Ḡ (U+1E20).
D'après ce que je crois avoir compris, la règle serait de ne proposer
que les lettres précomposées qui étaient présentes dans au moins une
table existant avant Unicode, afin de pouvoir représenter par un point
de code Unicode chaque caractère de chacune des tables nationales.
Post by Julien ÉLIE
Bonne soirée et d'avance merci pour vos éventuels éclairages.
Je te souhaite d'avoir d'autres réponses que la mienne, mieux documentées.

Cordialement,
--
Olivier Miakinen
Patrick Texier
2010-12-07 06:52:44 UTC
Permalink
Post by Olivier Miakinen
Post by Julien ÉLIE
Je vois un macron (U+0304) à utiliser en combinaison : R̄.
Mais le résultat n'est pas toujours joli : la barre est
décentrée sur la lettre.
C'est que la police que tu utilises n'a pas prévu de R avec macron.
Je ne pense pas que la présence ou l'absence de lettre précomposée
dans Unicode puisse améliorer les choses.
Le rendu dépend beaucoup de la police. Avec DejaVu_Sans_Mono, le macron
combinant est tellement collé à la lettre, qu'il faut monter en corps 16
pour apercevoir la présence de "quelque chose" au dessus du R.
cf <Loading Image...>, première ligne de
citation.
Post by Olivier Miakinen
Post by Julien ÉLIE
Cette lettre serait utile au serbo-croate d'après ce que
j'ai compris.
Pourtant, si vraiment il n'existe pas de R macron précomposé, alors je
pense que cela signifie que cette lettre n'existe dans aucun jeu de
caractères 8 bits normalisé. Je trouve ça étonnant pour une langue
européenne.
Dans ISO-8859-2, utilisé pour le croate [...]
Le croate peut aussi utiliser ISO-8859-16 qui ne dispose pas plus de ce
R macron.

Le « lexique des règles typographiques en usage à l'imprimerie
nationale » ne donne pas ce caractère pour le serbo-croate à « lettres
accentuées et diphtongues dans les langues en caractères latins », ni
pour aucune aucune langue. Je ne vois que le r accent aigu (ŕ U+0155) et
le r caron (ř U+0159).
--
Patrick Texier
Julien ÉLIE
2010-12-08 22:42:47 UTC
Permalink
Bonsoir Olivier et Patrick,

Je vous remercie tous les deux pour vos réponses.
Le « lexique des règles typographiques en usage à
l'imprimerie nationale » ne donne pas ce caractère
pour le serbo-croate à « lettres accentuées et
diphtongues dans les langues en caractères latins », ni
pour aucune aucune langue. Je ne vois que le r accent
aigu (ŕ U+0155) et le r caron (ř U+0159).
Je viens de me renseigner auprès de celui qui m'avait posé
initialement la question (au bureau).

Les signes diacritiques sur les voyelles en serbo-croate sont
utilisés dans les dictionnaires, les manuels scolaires,
la diction pour les acteurs, dans les cas d'homonymie
gênante ou pour préciser la prononciation d'un nom propre.

La lettre « r » est une semi-voyelle. Elle suit les mêmes
règles d'accentuation que les voyelles lorsqu'elle joue
le rôle d'une voyelle.

Il semble donc étonnant que l'on n'ait pas eu ce caractère
dans Unicode. Peut-être pour la raison mentionnée par Olivier.

Bonne soirée et à nouveau merci pour vos réponses instructives,
--
Julien ÉLIE

« Les soucis d'aujourd'hui sont les plaisanteries de demain.
Rions-en donc tout de suite. » (Henri Béraud)
Julien ÉLIE
2010-12-30 19:00:01 UTC
Permalink
Bonjour à tous,
Le « lexique des règles typographiques en usage à l'imprimerie
nationale » ne donne pas ce caractère pour le serbo-croate à « lettres
accentuées et diphtongues dans les langues en caractères latins », ni
pour aucune aucune langue. Je ne vois que le r accent aigu (ŕ U+0155) et
le r caron (ř U+0159).
Je viens d'avoir des exemples de mots utilisant ce r avec macron :

ù cr̄kvu (dans l'église), de cȓkva (église)
pàlidr̄vce (allumette)
ráskr̄šće (carrefour)

čètvr̄tī (quatrième)
nȃjpr̄vī (le premier de tous), de pȓvo (premier)
pȍgr̄dan (injurieux)
ȕbr̄zo (bientôt), de bȓzo (vite)
nèsvr̄šenī vȋd glȁgola (imperfectif)

zàvr̄šīm (je finis), zàvr̄šen (fini), de zavŕšiti (finir)
ìzvr̄šīm (j'exécute), ìzvr̄šīvši (exécutant), ìzvr̄šen (achevé), de
izvŕšiti (exécuter)
dòpr̄vši (arrivant), dȍpr̄la (acquise), de dòprijēti (atteindre)
zȁstr̄t (couvert), de zàstrijēti (couvrir)



R avec accent grave est sans doute encore plus courant, comme
dans le mot hrvatski (croate).

Bizarre que cette lettre n'ait pas été intégrée au jeu de caractères
ISO-8859-2…
--
Julien ÉLIE

« J'oubliais qu'Assurancetourix a une nouvelle corde à sa
harpe ! » (Astérix)
Jean-Marc Desperrier
2010-12-09 12:49:09 UTC
Permalink
Post by Olivier Miakinen
D'après ce que je crois avoir compris, la règle serait de ne proposer
que les lettres précomposées qui étaient présentes dans au moins une
table existant avant Unicode, afin de pouvoir représenter par un point
de code Unicode chaque caractère de chacune des tables nationales.
Oui, tout à fait. Mais c'est tellement pratique d'avoir les caractères
précomposées qu'on regrette assez les situations où ils manquent.

Le principe d'Unicode de ne pas encoder les caractères pré-composés se
heurte à la pratique que tout ceux qui existent déjà dans un encodage
préexistant sont encodés.

En pratique, ça veut dire que tous les scripts largement utilisés ont
droit à leurs lettres pré-composées, et que les seuls qui n'en n'ont pas
sont ceux très peu utilisés, largement défavorisés par l'informatique.

Du coup aussi, quand quelqu'un qui n'a pas des ressources illimitées se
lance dans un moteur d'affichage, il découvre que les scripts
constituant la très grande majorité de l'usage peuvent très bien se
gérer, sans avoir besoin de gérer réellement le décomposé. On ajoute
d'abord une transformation qui transforme comme il faut, et c'est bon.
Et ceux qui en ont vraiment besoin ne constituent pas une partie
suffisante de l'usage pour justifier économiquement de le faire.

Bénie soient les fontes calligraphiques qui renversent un peu cette
équation économiques : Pour pouvoir afficher correctement un texte
anglais avec une fonte comme Zapfino, il faut intégrer des mécanismes
par eux même à peu près suffisant pour vous permettre derrière
d'afficher jusqu'au tibétain.
Loading...