oxyd-x Posté 21 Septembre 2005 Posté 21 Septembre 2005 Salut, pour les besoins d'un de mes scripts, j'aimerais savoir si il est possible de convertir un texte d'un charset à un autre; puisque un exemple vaut mieux que mille explications :: brut : je suis un test à accentsutf-xx : je suis un test à accentsiso-8859-xx : je suis un test à accents je voudrais donc pouvoir convertir n'importe lequel de ces trois formats en texte brut (ou binarisé en utf par exemple) en sachant que je ne peut pas enlever les balises html; - donc, sans htmlentites (qui bloque mes balises); merci à tous
Dan Posté 21 Septembre 2005 Posté 21 Septembre 2005 Tu as les fonctions suivantes: utf8_decode -- Convertit une chaîne UTF-8 en ISO-8859-1string utf8_decode ( string data ) utf8_encode -- Convertit une chaîne ISO-8859-1 en UTF-8string utf8_encode ( string data ) qui te permettent déjà les conversions de UTF-8 en ISO et vice-versa. Pour info, à n'est pas de l'iso, c'est simplement un token HTML qui peut tout aussi bien fonctionner dans une page avec un charset UTF-8
loufoque Posté 22 Septembre 2005 Posté 22 Septembre 2005 Ce que tu appelles brut est sûrement de l'ISO-8859-1 (ou du windows-1252, dans ce cas, les conversions seraient plus problématiques). Ce que tu appelles utf-xx est utf-8. Ce que tu appelles iso-8859-xx semble être de l'ascii avec des entités html (truc vraiment sans intérêt).
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant