Aller au contenu

Sujets conseillés

Posté

Salut,

Je voulais savoir si Google préférait les codes ISO ou les entités HTML ?

C'est bête, mais dois-je plutôt mettre :

"énergumène" ou "énergumè" ?

Google fait il la différence ?

Et pour les visiteurs, ça change quelque chose ?

Merci de vos réponses.

Loupilo

Guest Hellway
Posté

Personellement, je ne suis pas plus au courant que toi sur le sujet, et effectivement, il serait intéressant de le savoir. La seule chose que je sais, c'est que si tu choisis bien ton jeu de caractère, tu n'est pas obligé d'utiliser les entités html pour les caractères spéciaux, mais je sais aussi que si tu utilise UTF-8 et les entités HTML, alors, le problème des jeux de caractères ne se posent pas et tu peux utiliser tous les caractères possibles grâce à Unicode et ainsi, un site multilinguiste est faisable dans de meilleures conditions.

Posté
je sais aussi que si tu utilise UTF-8 et les entités HTML, alors, le problème des jeux de caractères ne se posent pas et tu peux utiliser tous les caractères possibles grâce à Unicode et ainsi, un site multilinguiste est faisable dans de meilleures conditions.

Mais quelque chose est sûr : Google préfère quand même é ou é à un "é" brut :yoot:

Je sais qu'en UTF-8 tout est autorisé mais Google il aime pas trop...

Posté

La différence, c'est que google ne detecte pas le format utilisé, ne peut pas faire de transformation du langage utilisé lors de l'affichage.

Prenons le cas d'un simple é présent sur un site en UTF-8 et un autre é présent sur un autre site mais qui n'est pas en UTF-8. Google devrait normalement, renvoyer un affichage en UTF-8 pour éviter des bugs. Je m'explique : le "é" qui n'est pas dans un format unicode est convertit pour ne pas créer de bug avec l'affichage du "é" en UTF-8.

L'avantage residerait, non pas dans les accents, mais plus dans les caractères (chinoix - Kanji) qui n'auraient aucun problème à s'afficher (ses caractères sont inexistants en ISO-8859-1). Il arrive quelque fois à google de plancher sur le langage choisit par le site web et ceux pour plusieurs raisons.

La première est principalement dans le fait que l'UTF8 est très mal détécté, c'est à dire que vous mettez UTF8, mais que vous avez éditer votre page au format ISO (de mon experience sous windows, il est impossible de choisir l'encodage des fichiers lors de leur édition). Donc, en somme, il y a un mélange de formats, ce qui peut-être la cause d'affichage de points d'interrogation à la place des caractères ou lettres choisies.

Ou il se peut également que ce soit une erreur de charset au niveau de la configuration du serveur. En ce qui me concerne, je n'ai pour le moment rencontré aucun soucis de ce côté là.

Maintenant, d'un point de vue uniquement professionnel, il est préférable d'utilisé é au lieu de é puisque l'on donne directement l'entité html ce qui permet d'éviter des conflits lorsque les navigateurs ne connaissent pas l'UTF-8. Après tout, c'est une question de choix finalement ;)

Rajout : il se peut que ce soit votre navigateur lui-même ou que ce soit google qui oublit de définir le charset à utiliser, dans ce cas le navigateur internet utilise le charset par default. Ce n'est donc pas forcement une erreur qui provient de votre site

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...