Aller au contenu

Sujets conseillés

Posté (modifié)

Bonjour,

Dernièrement je me suis rendu compte que Google n'avait pas mis à jour le cache de ma page d'accueil à jour depuis le 31 juillet 2009.

C'est bien le contenu du cache de chacque page sur lequel se base Google pour extraire ses éléments clefs de recherche ? Donc si pas d'actualisation pas de nouveaux critères ?

J'ai vérifié Bing et ce dernier a par contre bien pris en compte la nouvelle version.

Je sais que GoogleBot passe sur le site car il suit les liens de la page d'accueil pour ensuite aller indexer les nouveaux articles. Ou alors il passe par le sitemap, mais dans les deux cas il continue à indexer du contenu récent.

Ma question principale concerne finalement la question de l'indexage d'une page d'accueil. Peut-on accélerer le processus ? Y'a-t-il des critères de popularité qui entrent en jeu ? Et dans mon cas présent, pourquoi met-il autant de temps à remettre à jour ce cache ?

J'ai un second site, donc la structure est exactement la même, sans jamais avoir fait de référencement et que je ne mets pas à jour faute de temps, et pourtant ce dernier dispose d'un cache de page d'accueil bien plus récente.

Mon site qui fait l'escargot question cache : www.hycity-car.com

Merci d'avance pour vos éclaircissements :)

Modifié par Dimitri
Posté (modifié)

Bonjour,

Dernièrement je me suis rendu compte que Google n'avait pas mis à jour le cache de ma page d'accueil à jour depuis le 31 juillet 2009.

../..

Mon site qui fait l'escargot question cache : www.hycity-car.com

Merci d'avance pour vos éclaircissements :)

peut être que le bot n est pas repassé sur ta page d accueil tout simplement

Modifié par Dan
Posté

Il me semble bien que le bot de Google ne remplace pas systématiquement le cache (Est-ce le même bot, d'ailleurs ?).

Donc, si la version en cache est ancienne, ne t'inquiètes pas, cela ne veut pas nécessairement dire que le nouveau contenu n'est pas indexé.

Posté

Les pros : Il y aurait pas un problème ? Si on fait la commande link sur son site, il y a beaucoup de pages qui se nomment : "www.hycity-car.com/index.php et quelque chose derrière" :wacko:

Posté

Effectivement, beaucoup d'urls différentes semblent mener à ta page d'accueil, il faudrait corriger ça :
/>http://www.hycity-car.com/?maf=12&sjt=6
/>http://www.hycity-car.com/?maf=&page=12
/>http://www.hycity-car.com/?pagecat=3

(etc)

Posté

Bien vu Arlette !

Comme le souligne également Captain-Torche il faut revoir entièrement la gestion du duplicate content sur ton site. En plus du problème des liens mentionnés par Captain, tu as également un souci avec l'accès avec ou sans www.

++

Patrick

Posté

Bien vu Arlette !

Faites péter le champagne ! :groupwave: 6 ans de lecture pour enfin pouvoir répondre quelque chose de sensé et avoir la reconnaissance d'un pro ! ... Patrick, je le mets au frais. On fêtera l'événement ! Arlette commence à comprendre quelque chose au webmastering !

Posté

Effectivement, beaucoup d'urls différentes semblent mener à ta page d'accueil, il faudrait corriger ça :
/>http://www.hycity-car.com/?maf=12&sjt=6
/>http://www.hycity-car.com/?maf=&page=12
/>http://www.hycity-car.com/?pagecat=3

(etc)

En fait ces urls datent de la première version de mon site.

Pour passer dans la nouvelle version plus propre, j'ai traité toutes les pages qui n'existaient plus selon une redirection vers la page d'accueil.

Il faudrait que je puisse supprimer les pages de l'index google qui n'ont plus lieu d'être donc... il y a une technique car je n'ai pas vu cela dans les outils webmaster google ou alors je suis passé à côté.

Nota : j'ai une balise "canonical" pour bien mettre que tout ce qui touche à la page d'accueil a une url principale en http://www.hycity-car.com/

tu as également un souci avec l'accès avec ou sans www.

Par contre je ne comprend pas cette remarque, pouvez-vous expliciter le sujet ?

Merci déjà pour vos différents retours :)

Posté

Patrick veut dire que chaque page est en doublon, vu qu'elle est accessible par www.tondomaine/page et par tondomaine/page

Quant aux "redirections", elles ne sont apparemment pas actives: elles affichent bien toutes la page d'accueil, mais elles n'ont pas d'en-tête 301. Elles sont donc toutes en doublon.

Posté

j'ai remarqué, de temps à autres, que la page et la date affichées lors de la visualisation du cache des SERP ne correspondait pas du tout aux requêtes ayant menées à ce résultat : du genre une date de cache d'il y a 2 semaines alors qu'on fait une requête sur un terme qui n'a été ajouté que la veille sur cette page

Posté

Il faut bien comprendre que l'affichage par Google n'est pas toujours en coréllation avec la vérité dans l'index de Google.

En l'occurrence, ce site est bien crawlé depuis les 20 derniers jours
/>http://www.google.fr/#q=site:http://www.hycity-car.com+voiture+hybride+daterange:2455090-2455120&hl=fr&filter=0&fp=3873581dfbafc2df (voir l'opérateur "daterange")

Par contre, une soumission dans les Google Webmaster Tools permettrait de visualiser les problèmes et régler pleins de paramètres essentiels.

Posté

Par contre, une soumission dans les Google Webmaster Tools permettrait de visualiser les problèmes et régler pleins de paramètres essentiels.

Justement, dans le webmaster tools je n'ai aucune alerte, à part un duplicata de balises meta...

Mais je viens de comprendre par rapport à ce qui est dit avant que mon routeur sur les anciennes adresses ne couvrent pas ces dernières par une redirection, j'ai un trou dans la raquette :whistling:

Je vais donc corriger cela.

Par contre je ne vois pas comment gérer la question du WWW et sans WWW sur le nom de domaine. Dans les google tools j'ai bien spécifié que je voulais la forme avec les WWW. Y'a-t-il une technique spécifique :?:

Posté

Pour la redirect, voici un code à mettre dans le .htaccess, à la racine du site. Le réglage dans GWT est uniquement cosmétique sur les résultats de recherche. Cela n'impacte pas comment tu configures ton site.

RewriteEngine on

RewriteCond %{HTTP_HOST} !www.tonsite.com$
RewriteRule (.*) http://www.tonsite.com/$1 [QSA,L,R=301]

Posté

Il me semble que la pluspart des hebergeur gere ce genre de trucs dans la console d'administration

Posté

Hmmm Dan pourra préciser, mais je crois que c'est assez dangereux de laisser cette manip au bon vouloir des hébergeurs.

Me rappelle plus pour lequel, mais c'était vraiment mal fichu.

Posté

2 hebergeurs ici proposent de gerer le problem dans la console d'administration

Ca marche plutot pas mal, grosso modo c'est de la 301, ca va pas chercher midi a quatorze heure...

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...