Aller au contenu

Sujets conseillés

Posté

Pour faciliter l'indexation de la totalité de mon site web (mix html statique et php), je pensais faire une page plan et définir via .htaccess ma page plan comme page 404 par défaut. N'ayant pas de robots.txt, les spiders se verraient servir cette page, pleine de liens html vers les pages dynamiques.

Est ce une bonne solution d'après vous? Une page du site peut elle etre en même temps une page 404?

Posté

Pourquoi pas... Sur mes 404 j'ai bien l'entete/menu/pied de page avec des liens.... Mais je pense que pour tes visiteurs tu devrais spécifier l'erreur 404 quelque part.

Autre chose, je ne sais pas si les robots suivent les liens lorsqu'ils tombent sur une erreur 404...

Posté

Oui je pensais mettre un message du style "Oups la page que vous avez demandé n'existe pas... Mais l'information que vous recherchez se trouve probablement dans les liens suivants"

Posté

Je pense que c'est une bonne idée pour tes visiteurs... Pour les robots je ne pense pas que ce soit vraiment utile car je ne sais pas ce qu'ils font lorsqu'ils tombent sur une erreur 404

Posté

Sebastien,

La page 404 personnalisée est une bonne idée, mais n'est pas sans danger si elle est implémentée n'importe comment..

Par exemple, il faut dans ce cas avoir un fichier robots.txt (même vide) pour éviter que cette page soit mal interprétée.

Il faut aussi vérifier que l'entête retournée soit bien 404, et pour ce faire éviter l'utilisation d'URLs absolues dans la directive du fichier .htaccess

Le bon exemple:

ErrorDocument  404  /mapage404.php

Le mauvais exemple:

ErrorDocument 404 http://www.mondomaine.com/mapage404.html

Ce dernier exemple ne retournera pas une entête 404...

La page outils du Hub permet de valider les entêtes http retournées.

Dan

Posté

Merci Dan,

Pourquoi faut-il un robots.txt? n'est il pas interessant que ce fichier soit manquant pour que la page 404 soit servie au spider à la place?

Posté
Pourquoi faut-il un robots.txt? n'est il pas interessant que ce fichier soit manquant pour que la page 404 soit servie au spider à la place?

C'est intéressant à la seule condition que l'entête 404 soit retournée.

Sinon, le risque est que le robot pourra tenter d'interpréter cette page comme un fichier robots.txt, avec des résultats totalement imprévisibles...

Un de mes clients canadiens s'est retrouvé sans la moindre page dans Google au bout de 2 semaines suite à ce type de mauvaise manipulation. C'est arrivé aussi à un membre du Hub qui se reconnaîtra peut-être s'il lit ceci ;)

Dan

PS: cette solution est implémentée sur le Hub, et une page 404 personnalisée donne le plan des publications avec une entête 404, tu peux vérifier à la page outils ;)

Posté

Merci beaucoup pour ces explications! :) Et le fait que ma page 404 soit également une page plan liée sur le site ne va pas poser probleme?

Posté
Merci beaucoup pour ces explications! :) Et le fait que ma page 404 soit également une page plan liée sur le site ne va pas poser probleme?

Pas plus que cela n'en pose pour la page 404 du Hub.

En fait, les moteurs ne connaissent pas le nom de la page affichée, pas de risque que cela impacte le positionnelment de cette page "plan du site".

Regardes l'URL: -http://www.webmaster-hub.com/toto.php

Tu verras que même si la page /publications/plan.php3 est affichée, l'URL ne change pas dans la barre d'adresse.

Une mesure de sécurité pour cette page d'erreur personnalisée est d'utiliser la balise <base href=....> pour qu'elle s'affiche correctement même si elle force un changement de répertoire.

Exemple: -http://www.webmaster-hub.com/je/suis/perdu/toto.php

C'est pas beau ça ? ;)

Dan

Posté

moi je trouve ça génial le plan en 404! Quand je serai grande :whistling: , euh , ben je saurai le faire!

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...