Aller au contenu

Sujets conseillés

Posté

Parce que Google crawl TOUTES les pages qui lui sont atteignables si celles-ci n'ont aucune restriction (meta, robots,...). Donc si ton dossier /web/img/chevaux_pt/ est accessible, depuis une page déjà indexée, Google va crawler la page. Pour remédier à ce problème, il faut soit spécifier dans un htaccess de générer une erreur 403 ou bien de mettre un index avec un noindex. Ou tout simplement un fichier robots à la racine.

Quant à la page /web/traitement.php, aucun lien présent sur ton site peut-être, mais d'autres sites peuvent avoir lié cette page, ce qui expliquerait sa présence dans l'index de Google. Sinon le mieux c'est de créer un dossier qui contient toutes les pages de traitement que tu ne souhaites pas les voir indexer et d'interdire ce dossier complet par robots.txt.

Posté

Bonjour et bienvenue sur le hub,

Un seul lien mal construit peut entraîner l'indexation non souhaitée de nombreuses pages.

Exemple:

Sur [i]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D'>]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D,

il y a un lien "Parent Directory" vers [i]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/

où il y a un autre lien "Parent Directory" vers [i]http://www.sos-chevaux.fr/web/

où il y a un lien "traietement.php" vers [i]http://www.sos-chevaux.fr/web/traitement.php.

Si tu ne veux pas que ces pages soient visitées par Google, utilise un fichier robots.txt ou protège l'accès par un mot de passe. Si tu acceptes que Google visite ces pages, mais que tu ne veux pas qu'elles apparaissent dans les résultats de recherche, utilise la balise meta "robots" avec "noindex".

Jean-Luc

Posté

Ce type de lien avec ses paramètres était présent dans tes pages "index of". Examine le dessus des colonnes de ces pages et tu retrouveras ce genre de lien.

Jean-Luc

Posté

Merci beaucoup :)

Comment puis-je faire pour supprimer les pages comme celles-ci : www.sos-chevaux.fr/web/?C=N;O=D :( de l'index de google ?

Posté

Utilisation de Google Webmasters Tools:

Tableau de bord > Outils > URL à supprimer

Ou bien un fichiers robots.txt, ou bien ajouter une balise meta robot avec comme valeur noindex, ou encore retourner un header autre que 200.

Posté

J'ai essayé d'utiliser l'outils google pour webmaster mais voici sa réponse : Refusé : Le contenu que vous avez envoyé pour la suppression du cache s'affiche sur une page tierce.

Est ce que si je mets dans mon fichier robots.txt les adresses telles que : www.sos-chevaux.fr/web/?C=M;O=A elles vont disparaitre de l'index ?

Posté

Je ne crois pas que tu doives t'inquiéter de la présence de ces pages dans l'index Google.

Ces adresses sont actuellement redirigées vers la page d'accueil de ton site. Elles devraient donc disparaître automatiquement de l'index, mais c'est vrai que cela peut prendre du temps. De toute façon, peu d'internautes cliquent sur le lien "En cache" des résultats de Google. Je pense aussi que ces pages ne vont pas ressortir sur des recherches usuelles. En pratique, seuls les webmasters utilisent la commande site:.

Concernant la redirection utilisée, tu utilises malheureusement une redirection 302 vers /index.php. Un code 404 ou une redirection 301 vers / serait préférable.

Jean-Luc

Posté

Salut,

Pour que google te supprime une page il faut que ta page renvoie un code erreur 404. Sinon il refuse toute demande de suppression.

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...