Aller au contenu

charset iso-8859-xx, utf-xx


Sujets conseillés

Posté

Salut,

pour les besoins d'un de mes scripts, j'aimerais savoir si il est possible de convertir un texte d'un charset à un autre;

puisque un exemple vaut mieux que mille explications ;) ::

brut : je suis un test à accents
utf-xx : je suis un test à  accents
iso-8859-xx : je suis un test à accents

je voudrais donc pouvoir convertir n'importe lequel de ces trois formats en texte brut (ou binarisé en utf par exemple) en sachant que je ne peut pas enlever les balises html;

- donc, sans htmlentites (qui bloque mes balises);

merci à tous ;)

Posté

Tu as les fonctions suivantes:

utf8_decode -- Convertit une chaîne UTF-8 en ISO-8859-1

string utf8_decode ( string data )

utf8_encode -- Convertit une chaîne ISO-8859-1 en UTF-8

string utf8_encode ( string data )

qui te permettent déjà les conversions de UTF-8 en ISO et vice-versa.

Pour info, à n'est pas de l'iso, c'est simplement un token HTML qui peut tout aussi bien fonctionner dans une page avec un charset UTF-8 :)

Posté

Ce que tu appelles brut est sûrement de l'ISO-8859-1 (ou du windows-1252, dans ce cas, les conversions seraient plus problématiques).

Ce que tu appelles utf-xx est utf-8.

Ce que tu appelles iso-8859-xx semble être de l'ascii avec des entités html (truc vraiment sans intérêt).

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...