Guest Hellway Posté 6 Mars 2004 Posté 6 Mars 2004 Voilà, j'ai un petit problème de réfèrencement et j'aimerai savoir ce que les experts en la matière en pense. Alors, mon site est rédigé d'un manière qui m'est, je pense, assez propre. En effet, celui-ci n'est consultable qu'avec l'index (index.php) et des requêtes CGI ,POST ou COOKIE. Jusqu'ici, rien de méchant. Seulement, j'ai un très gro dillemme à régler. Mon site est assez bien référencé chez google, mais un nombre conséquent de ses références à mon site dirigent tout droit le surfeur sur une erreur 404. Ca fait pas très sérieux pour une première visite... Le problème, c'est que dans mon script, je vérifie l'existance du fichier à inclure, et si il existe pas, j'inclus un fichier spécifique aux erreurs 404 ou 401 selon le cas. Or, je souhaite renvoyer un Statut Erreur 404 ou 401 à l'aide de la fonction header() de PHP mais j'ai peur que si je fais ça, google considère que c'est le fichier index.php qui n'existe pas et pas le fichier pointé par le CGI. Bref, j'espère avoir été suffisamment clair, et j'espère aussi obtenir une réponse . Merci à ceux qui auront pris le temps de me lire...
Anonymus Posté 6 Mars 2004 Posté 6 Mars 2004 Bonjour, tu trouveras un outil ici pour analyser les entetes renvoyées par tes pages, pour savoir si elles renvoient un 404. Tu trouveras ici une publication pour gérer efficacement les erreurs 404. Il est conseillé, en cas de page inconnue, de faire une page "erreur 404" personnalisée, ou de renvoyer au plan du site (avec un petit mot), mais en aucun cas de renvoyer un header 404. De plus, de nombreux annuaires n'accepteront pas de te référencer si tu as trop de pages qui ne mènent nulle part. Voilà, espérant avoir répondu à ta question A+, Anonymus
Guest Hellway Posté 7 Mars 2004 Posté 7 Mars 2004 En fait, je crois que tu n'as pas saisi mon problème. Si je veux renvoyer une erreur 404, c'est que la page n'éxiste plus du tout. Il n'y a plus aucun lien qui renvoie sur cette dernière mais elle est toujours indexée sur Google. De plus, je suis chez free, donc, je ne peux utiliser les fichiers .htaccess que pour les redirections d'erreurs 404 et 501. En réalité, ma question la plus importante est : Si je renvoie une entête d'erreur 404 avec cet URL : http://fusa2.free.fr/?Rub=Bidulequiexiste pas Est-ce que google ou un autre moteur va considérer que c'est carrément http://fusa2.free.fr qui n'existe pas. Ou alors, est-ce qu'il va arrêter d'indexer ces pages qui n'existent plus, sans pour autant arrêter d'indexer toutes les pages de mon site. Si quelqu'un connaît l'effet que ça peut avoir... Sinon, je serais bien obligé de faire le test et je posterai ici le résultat...
Dan Posté 7 Mars 2004 Posté 7 Mars 2004 Salut Hellway, Dans la mesure ou le nombre de paramètres est limité, les URLs index.php?var1=toto et index.php?var2=tutu sont considérées comme des pages différentes. Donc renvoyer une 404 pour l'une d'elle serait sans incidence sur l'indexation de l'autre. Tous les moteurs gèrent correctement les URLs dynamiques, à l'exception d'altavista qui ne les suit que pour les inclusions payantes. Si tes URLs ont 2 paramètres ou moins, tu ne risques donc rien (sauf dégager d'altavista et perdre ton unique visiteur mensuel/annuel pour ce moteur ) Dan
Nicolas Posté 7 Mars 2004 Posté 7 Mars 2004 bonjour Hellway, Il n'est pas nécessaire de créer une fonction header pour générer une erreur 404. Si apache est bien configuré (c'est le cas puisque ton site est hébergé chez free) tes pages inexistantes renverrons un entête "HTTP/1.1 404 Not Found". Pour rédiriger tes "broken links" vers une page d'erreurs personnalisée il suffit de créer une nouvelle directive dans ton fichier .htaccess du style : ErrorDocument 404 http://fusa2.free.fr/error.html Correction : mettre uniquement une url courte ErrorDocument 404 /error.html car une url complète donne un code 200. Merci à dan pour cette correction importante. Ensuite tu créés ta page d'erreur en la nommant "error.html" (elle peut avoir un autre nom bien sur). Les pages qui n'existent plus vont disparaitre de l'index google après le prochain "full crawl". Tu peux accéler les choses en supprimant les pages de l'index google via ce formulaire http://services.google.com:8882/urlconsole...d&lastcmd=login. Il faut compter 24 à 48 heures. J'espère que ca répond à ta demande.
Guest Hellway Posté 7 Mars 2004 Posté 7 Mars 2004 Merci pour les infos les gars. Par contre, pour la redirection avec le .htaccess chez Free, c'est justement le problème puisque google indexe ces pages. Mon .htaccess : ErrorDocument 404 Site/index.php?Rub=Erreur&Act=404 Et les pages indexées : http://www.google.com/search?q=site%3Afusa...rche+Google&lr= Le pire c'est avec les fichiers externes... Google va à la page d'erreur mais il garde l'url : pagepasbonne.html et suis les liens pagepasbonne.html?Rub=cgi etc... M'enfin, ce qu'a dit Dan me rassure, je vais procéder comme ça. Et je vais essayer le formulaire de google aussi. Merci
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant