Aller au contenu

Sujets conseillés

Posté

Bonjour,

Lorsque je consulte mes statistiques je constate que ma page la plus visitée est index.html, or elle n'existe pas. Mon accueille est index.php.

Et dans le même temps je constate que googlebot ne consulte presque jamais les autres pages de mon site (effectué une fois) alors qu'il passe au moins une fois par jour depuis environ 2 mois :

googlebot.com www.monsite.fr - [02/Jan/2006:01:44:28 +0100] "GET /robots.txt HTTP/1.1" 200 24

googlebot.com www.monsite.fr - [02/Jan/2006:01:44:29 +0100] "GET / HTTP/1.1" 200 1521"

puis il s'en va

Le problème est-il lié ? D'où viennent ces demandes de la page index.html.

Posté (modifié)

De côté là il n'y a pas de soucis, la page est bien indexée. Et lorsque l'on souhaite accéder à mon site en utilisant l'adresse www.monsite.fr on accède bien à la page index.php

Mais d'où viennent ces requêtes de la page index.html ?

[edit]Excuses moi Dan, je n'avais pas bien regardé ton lien. Effectivement yahoo reference un certain nombre de lien vers www.monsite.fr/index.html pourtant lorsque l'on se rend sur ces pages les liens sont du type -http://www.monsite.fr donc je ne suis pas avancé[/edit]

Modifié par drdroopy
Posté (modifié)

Peut-etre que ton référencement date et qu'avant tu utilisait ton index.html, ce qui ferait que tous tes vieux BL meneraient vers ton index.html.

Mais as-tu beaucoup d'erreurs 404 ?

Utilises l'url rewriting ?

Modifié par bigornot
Posté (modifié)

en parlant de site qui font mal leurs liens vers les pages vers lesquelles ils pointent ... Unix est case sensitive sur le nom des pages, mais pas Windows/IIS ... du coup lorsque des sites font des liens avec des majuscules dans les noms des fichiers, cela génère des duplicates content (en combinant minuscule/majuscule sur 10 caractères, on devrait pouvoir générer 1024 pages en duplicat content) ... :wacko:

exemple : http://www.google.fr/search?q=site:e-dvd-d...GLI:fr&filter=0 (résultats 1 & 2) ... pas terrible tout ça ... :whistling:

Modifié par cendrillon
Posté
Mais as-tu beaucoup d'erreurs 404 ?

Utilises l'url rewriting ?

<{POST_SNAPBACK}>

Effectivement, je n'ai pas beaucoup d'erreur 404, en tout cas beaucoup moins que de requete de la fameuse page index.html. Je n'utilise pas encore d'url rewriting est je n'ai jamais referencer mon site avec le .html. Tout ça est peut être une bizarrerie d'urchin.

Posté

En effet, c'est bizarre...

Parles-en à ton hébergeur...

Et essaie aussi de créer une page index.html sur laquelle tu mettrais en place un petit systeme de statistiques, voir si ton serveur a vraiment rêvé :)

Posté

Bonjour,

plutôt que de créer une page inde.html pour y voir des stats ;)

Je te conseil de faire un petite redirection 301 de :

-http://www.croisieres-saonoises.fr/index.html vers

-http://www.croisieres-saonoises.fr/

Posté
Je n'utilise pas encore d'url rewriting est je n'ai jamais referencer mon site avec le .html. Tout ça est peut être une bizarrerie d'urchin.

<{POST_SNAPBACK}>

as tu compris ce que j'essayais de te dire et as tu bien lu le post de Dan ?

Une recherche sur Yahoo permet de trouver 30 liens vers cette page :)

http://fr.search.yahoo.com/search?p=link%3...=wrt&meta=vl%3D

<{POST_SNAPBACK}>

tu as 30 liens qui pointent vers la page index.html, les bots suivent ces liens ... jusque là rien d'anormal à ce que tu trouves des traces de passage de bots ou d'internautes sur cette page ... ils se cassent le nez et finissent par ne plus repasser ... aucune bizarrerie d'urchin dans tous ça ... :fou:

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...