chouxe Posté 25 Avril 2009 Posté 25 Avril 2009 Bonjour, J'ai un petit problème avec l'indexation de google. Est ce que quelque saurait pourquoi il indexe mes pages indexe of ? voici mes pages indexées : www.sos-chevaux.fr En plus il rajoute des arguments comme pour la page suivante : www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D Il indexe aussi une page : www.sos-chevaux.fr/web/traitement.php alors qu'aucun lien ne pointe dessus Merci à tous.... clémentine
yuston Posté 26 Avril 2009 Posté 26 Avril 2009 Parce que Google crawl TOUTES les pages qui lui sont atteignables si celles-ci n'ont aucune restriction (meta, robots,...). Donc si ton dossier /web/img/chevaux_pt/ est accessible, depuis une page déjà indexée, Google va crawler la page. Pour remédier à ce problème, il faut soit spécifier dans un htaccess de générer une erreur 403 ou bien de mettre un index avec un noindex. Ou tout simplement un fichier robots à la racine. Quant à la page /web/traitement.php, aucun lien présent sur ton site peut-être, mais d'autres sites peuvent avoir lié cette page, ce qui expliquerait sa présence dans l'index de Google. Sinon le mieux c'est de créer un dossier qui contient toutes les pages de traitement que tu ne souhaites pas les voir indexer et d'interdire ce dossier complet par robots.txt.
Jeanluc Posté 26 Avril 2009 Posté 26 Avril 2009 Bonjour et bienvenue sur le hub, Un seul lien mal construit peut entraîner l'indexation non souhaitée de nombreuses pages. Exemple: Sur [i]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D'>]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D, il y a un lien "Parent Directory" vers [i]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/ où il y a un autre lien "Parent Directory" vers [i]http://www.sos-chevaux.fr/web/ où il y a un lien "traietement.php" vers [i]http://www.sos-chevaux.fr/web/traitement.php. Si tu ne veux pas que ces pages soient visitées par Google, utilise un fichier robots.txt ou protège l'accès par un mot de passe. Si tu acceptes que Google visite ces pages, mais que tu ne veux pas qu'elles apparaissent dans les résultats de recherche, utilise la balise meta "robots" avec "noindex". Jean-Luc
chouxe Posté 26 Avril 2009 Auteur Posté 26 Avril 2009 Merci beaucoup pour la réponse. Mais je ne comprends pas je n'ai jamais mis de lien comme cela : http://www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D dans mon site c'est pour cela que je ne comprend pas d'où ça sort. Et pourquoi rajoute-t'il des arguments ?
Jeanluc Posté 26 Avril 2009 Posté 26 Avril 2009 Ce type de lien avec ses paramètres était présent dans tes pages "index of". Examine le dessus des colonnes de ces pages et tu retrouveras ce genre de lien. Jean-Luc
chouxe Posté 26 Avril 2009 Auteur Posté 26 Avril 2009 Merci beaucoup Comment puis-je faire pour supprimer les pages comme celles-ci : www.sos-chevaux.fr/web/?C=N;O=D de l'index de google ?
yuston Posté 26 Avril 2009 Posté 26 Avril 2009 Utilisation de Google Webmasters Tools: Tableau de bord > Outils > URL à supprimer Ou bien un fichiers robots.txt, ou bien ajouter une balise meta robot avec comme valeur noindex, ou encore retourner un header autre que 200.
chouxe Posté 27 Avril 2009 Auteur Posté 27 Avril 2009 J'ai essayé d'utiliser l'outils google pour webmaster mais voici sa réponse : Refusé : Le contenu que vous avez envoyé pour la suppression du cache s'affiche sur une page tierce. Est ce que si je mets dans mon fichier robots.txt les adresses telles que : www.sos-chevaux.fr/web/?C=M;O=A elles vont disparaitre de l'index ?
Jeanluc Posté 27 Avril 2009 Posté 27 Avril 2009 Je ne crois pas que tu doives t'inquiéter de la présence de ces pages dans l'index Google. Ces adresses sont actuellement redirigées vers la page d'accueil de ton site. Elles devraient donc disparaître automatiquement de l'index, mais c'est vrai que cela peut prendre du temps. De toute façon, peu d'internautes cliquent sur le lien "En cache" des résultats de Google. Je pense aussi que ces pages ne vont pas ressortir sur des recherches usuelles. En pratique, seuls les webmasters utilisent la commande site:. Concernant la redirection utilisée, tu utilises malheureusement une redirection 302 vers /index.php. Un code 404 ou une redirection 301 vers / serait préférable. Jean-Luc
Djames-Allen Posté 27 Avril 2009 Posté 27 Avril 2009 Salut, Pour que google te supprime une page il faut que ta page renvoie un code erreur 404. Sinon il refuse toute demande de suppression.
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant