Vincent Ramos
2004-09-13 15:17:08 UTC
Bonjour,
Je n'ai pas trouvé de forum vraiment adapté à ma question. C'est
cependant sur celui-ci que je pense pouvoir trouver les conseils les
plus éclairés.
Voici : en échangeant du texte brut entre deux PC (un sous Win98
l'autre sous GNU/Linux) via une passerelle samba qui intercepte les
WinPopup de Win98, j'obtiens, dans le sens Win --> Linux des choses
étranges (pour information, les données de WinPopup sont transformées
en texte brut que je n'ai plus qu'à traiter).
Les caractères non ASCII sont en effet convertis dans un format que
je ne comprends pas. Par exemple, pour les lettres diacritées
fondamentales, j'obtiens (en hexadécimal) :
* é = 0xC3 0x9A ;
* è = 0xC3 0x9E ;
* à = 0xC3 0x93, etc.
Ce n'est pas de l'UTF-8 mais je trouve étrange que ça en soit très
proche : 0xC3 0x9A au lieu de 0xC3 0xA9, par exemple, cela me frappe.
Ne serait-ce pas dû à une question de gros ou petit boutisme ? Si
oui, comment, avec recode par exemple, corriger le tir pour obtenir
de l'UTF-8 bien formé ?
Les autres caractères, cependant, ne suivent pas ce principe.
Merci de vos conseils.
Je n'ai pas trouvé de forum vraiment adapté à ma question. C'est
cependant sur celui-ci que je pense pouvoir trouver les conseils les
plus éclairés.
Voici : en échangeant du texte brut entre deux PC (un sous Win98
l'autre sous GNU/Linux) via une passerelle samba qui intercepte les
WinPopup de Win98, j'obtiens, dans le sens Win --> Linux des choses
étranges (pour information, les données de WinPopup sont transformées
en texte brut que je n'ai plus qu'à traiter).
Les caractères non ASCII sont en effet convertis dans un format que
je ne comprends pas. Par exemple, pour les lettres diacritées
fondamentales, j'obtiens (en hexadécimal) :
* é = 0xC3 0x9A ;
* è = 0xC3 0x9E ;
* à = 0xC3 0x93, etc.
Ce n'est pas de l'UTF-8 mais je trouve étrange que ça en soit très
proche : 0xC3 0x9A au lieu de 0xC3 0xA9, par exemple, cela me frappe.
Ne serait-ce pas dû à une question de gros ou petit boutisme ? Si
oui, comment, avec recode par exemple, corriger le tir pour obtenir
de l'UTF-8 bien formé ?
Les autres caractères, cependant, ne suivent pas ce principe.
Merci de vos conseils.