deuletor Posté 28 Mai 2007 Posté 28 Mai 2007 bonjour voila je me suis apercu en faisant une verification de mes urls dans un generateur de sitemap que certaine de mes urls descriptions et titres comportant des caracteres speciaux comme é,è.. ne safiché pas exemple bébé donne bb. j'ai reverifier dans google et il me l affiche correctement avec les caracteres speciaux. mais me vient alors cette question : google me penalise t il pas en indexant ses urls vu que le generateur de sitemap l'affiche sans ses caracteres?
KaRaK Posté 28 Mai 2007 Posté 28 Mai 2007 Bonjour, Google est assez clair sur l'encodage des fichiers sitemap : http://www.google.fr/support/webmasters/bi...py?answer=35653 Aujourd'hui même si il est possible d'acheter des noms de domaine avec accent, il ne faut mieux pas proposer ce type d'url
deuletor Posté 28 Mai 2007 Auteur Posté 28 Mai 2007 mais si je ne fait pas de fichiers sitemap google me penalise t il vu qu'a l affichage tous semble correct?. car pour faire court en faite au depart je voulais voir si j avais pas de duplicate content et d'url canonique donc j'ai verifier avec un generateur de sitemap et la je me suis apercu de cet erreur et m'interroge sur la façon dont il l'avait indexé.
kadafi Posté 28 Mai 2007 Posté 28 Mai 2007 Pour ne pas être pénalisé ne met pas accent dans tes urls.
deuletor Posté 28 Mai 2007 Auteur Posté 28 Mai 2007 dans les url oui mais dans les meta ? c'est sa mon probleme car dans ma base tout est sous se format é alors que j aurais du mettre é malgrés tout sa passe dans le moteur. je pensse que je me pose trop de question
snwoman49 Posté 28 Mai 2007 Posté 28 Mai 2007 Les URL avec accents que google indexe sur mon site ne posent pas de problèmes particulier, j'apparais bien haut sur les requêtes. Ca ne doit pas poser énormement de soucis.
deuletor Posté 28 Mai 2007 Auteur Posté 28 Mai 2007 je viens de les enlever seulement sur les urls et laisser sur les titres descriptions mot clés on verra bien au pire pour la prochaine fois je serais comment faire
yep Posté 29 Mai 2007 Posté 29 Mai 2007 Peut-être devrais-tu te renseigner sur ce qu'est l'encodage de caractères. Ton problème semble être simple, tes pages proposent de l'ISO-8859-1 alors que ton sitemap est en UTF-8, ou vice versa. A toi d'encoder correctement ces caractères. Pour info : http://openweb.eu.org/articles/jeux_caracteres/
Florent V. Posté 29 Mai 2007 Posté 29 Mai 2007 je pense que je me pose trop de question Oui, trop ou pas assez. Voici quelques questions supplémentaires en bonus : - Connais-tu la problématique de l'encodage des caractères ? Encodage réel (iso-8859-1, UTF-8, etc.), et encodage déclaré (balise META et surtout déclaration dans les en-têtes HTTP !) ? Si non, je t'invite à lire ceci. - À ton avis, est-ce que Google dispose de la technologie suffisante pour gérer correctement les encodages de caractères ? - Le fait de gérer correctement les encodages de caractères ne permettrait-il pas aux moteurs de recherche de fournir des résultats plus précis pour une langue donnée, voire de donner des résultats tout court pour les langues n'utilisant pas les caractères latins ? - Comment Google gère-t-il google.co.jp ? Voici par exemple une requête de test (caractères japonais choisis au hasard dans un texte, ça ne veut peut-être rien dire). Voilà pour la question de l'encodage des caractères et de sa gestion par les moteurs. Sur les détails, on pourra discuter des requêtes avec et sans diacritiques (accents, cédille, tréma, etc.), mais le principe général c'est : ça marche, parce que 1) c'est techniquement possible et 2) ça rentre dans le business model des moteurs (fournir des résultats pertinents...). Ensuite, pour les URL, c'est différent. Les URL ne sont pas des documents encodés, mais répondent à une norme plus restrictive. Mais ça a déjà été indiqué.
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant