Jean-Marc Desperrier
2004-09-13 17:15:37 UTC
Tiens, je viens de me rendre compte que cet accent aigu solitaire fait
partie des � combining diacritical marks �. Ne faut-il pas le mettre
*avant* le caract�re � modifier plut�t qu'apr�s ?
Cela donnerait � priv'e � au lieu de � prive' � et � priv%cc%81e � au
lieu de � prive%cc%81 �.
non, je ne pense paspartie des � combining diacritical marks �. Ne faut-il pas le mettre
*avant* le caract�re � modifier plut�t qu'apr�s ?
Cela donnerait � priv'e � au lieu de � prive' � et � priv%cc%81e � au
lieu de � prive%cc%81 �.
(sur fciws on m'a dit que c'est normal)
qu'ils modifient.
Cela �tant,
- chez moi la page est d�j� en UTF-8 (Mozilla page info dixit) ;
tiens, avec moi aussi, je croyais que non- chez moi la page est d�j� en UTF-8 (Mozilla page info dixit) ;
et malgr� ca ca ne s'affiche pas comme il faut ?
brut (� l'int�rieur d'une balise <PRE>, ainsi que les 'text/plain', en
l'occurence c'est le premier cas).
Une limitation certainement un peu regrettable.
Si je clique sur le lien
(http://tdecontes.hd.free.fr/aide/web/prive%cc%81/), j'arrive sur une
page d'erreur avec le contenu suivant :
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML><HEAD>
<TITLE>403 Forbidden</TITLE>
</HEAD><BODY>
<H1>Forbidden</H1>
You don't have permission to access /aide/web/privé/
on this server.<P>
<HR>
<ADDRESS>Apache/1.3.29 Server at tDeContes.hd.free.fr Port 80</ADDRESS>
</BODY></HTML>
Et si je force manuellement cette page � s'afficher en UTF-8, alors
l'apostrophe s'affiche bel et bien au-dessus du 'e' (il n'y a plus le
<PRE>).
Cette page d'erreur 403 est configur�e dans Apache pour �tre renvoy�e en
ISO-8859-1, ce qui m'oblige � forcer pour avoir le UTF-8. L'en-t�te
suivant est pr�sent :
wget -S --spider http://tdecontes.hd.free.fr/aide/web/prive%cc%81/
6 Content-Type: text/html; charset=iso-8859-1
Alors que la premi�re page elle ne pr�cise rien :
wget -S --spider http://tdecontes.hd.free.fr/aide/web/
6 Content-Type: text/html
Un peu curieux, mais je suppose que la deuxi�me est auto-g�n�r� par un
module qui ne pr�cise pas l'encodage, et que la premi�re est extraite
d'une liste de page pr�sente par d�faut avec Apache, avec une version
par langue, et des instruction dans le config de apache qui font qu'il
choisit l'encodage en fonction de la langue ... Enfin, �a peut �tre
autre chose, il faudrait regarder en d�tail.
Ah, au fait, le probl�me � la base est que le nom n'est pas g�n�r� sous
la forme de normalisation C, ce qui devrait �tre le cas dans tous les
�diteurs sous peine d'emmerdes s�rieuses.
Cf Formes de normalisation dans la traduction fran�aise d'unicode :
http://cooptel.qc.ca/%7Epandries/pdf/Chapitre-6.pdf
Je ne vois pas bien s'il y a une diff�rence avec le TR-15 :
http://www.unicode.org/reports/tr15/