Dimitri Posté 14 Octobre 2009 Posté 14 Octobre 2009 (modifié) Bonjour, Dernièrement je me suis rendu compte que Google n'avait pas mis à jour le cache de ma page d'accueil à jour depuis le 31 juillet 2009. C'est bien le contenu du cache de chacque page sur lequel se base Google pour extraire ses éléments clefs de recherche ? Donc si pas d'actualisation pas de nouveaux critères ? J'ai vérifié Bing et ce dernier a par contre bien pris en compte la nouvelle version. Je sais que GoogleBot passe sur le site car il suit les liens de la page d'accueil pour ensuite aller indexer les nouveaux articles. Ou alors il passe par le sitemap, mais dans les deux cas il continue à indexer du contenu récent. Ma question principale concerne finalement la question de l'indexage d'une page d'accueil. Peut-on accélerer le processus ? Y'a-t-il des critères de popularité qui entrent en jeu ? Et dans mon cas présent, pourquoi met-il autant de temps à remettre à jour ce cache ? J'ai un second site, donc la structure est exactement la même, sans jamais avoir fait de référencement et que je ne mets pas à jour faute de temps, et pourtant ce dernier dispose d'un cache de page d'accueil bien plus récente. Mon site qui fait l'escargot question cache : www.hycity-car.com Merci d'avance pour vos éclaircissements Modifié 14 Octobre 2009 par Dimitri
SLC71 Posté 14 Octobre 2009 Posté 14 Octobre 2009 (modifié) Bonjour, Dernièrement je me suis rendu compte que Google n'avait pas mis à jour le cache de ma page d'accueil à jour depuis le 31 juillet 2009. ../.. Mon site qui fait l'escargot question cache : www.hycity-car.com Merci d'avance pour vos éclaircissements peut être que le bot n est pas repassé sur ta page d accueil tout simplement Modifié 14 Octobre 2009 par Dan
captain_torche Posté 14 Octobre 2009 Posté 14 Octobre 2009 Il me semble bien que le bot de Google ne remplace pas systématiquement le cache (Est-ce le même bot, d'ailleurs ?). Donc, si la version en cache est ancienne, ne t'inquiètes pas, cela ne veut pas nécessairement dire que le nouveau contenu n'est pas indexé.
Arlette Posté 14 Octobre 2009 Posté 14 Octobre 2009 Les pros : Il y aurait pas un problème ? Si on fait la commande link sur son site, il y a beaucoup de pages qui se nomment : "www.hycity-car.com/index.php et quelque chose derrière"
captain_torche Posté 14 Octobre 2009 Posté 14 Octobre 2009 Effectivement, beaucoup d'urls différentes semblent mener à ta page d'accueil, il faudrait corriger ça :/>http://www.hycity-car.com/?maf=12&sjt=6/>http://www.hycity-car.com/?maf=&page=12/>http://www.hycity-car.com/?pagecat=3 (etc)
Patrick Posté 14 Octobre 2009 Posté 14 Octobre 2009 Bien vu Arlette ! Comme le souligne également Captain-Torche il faut revoir entièrement la gestion du duplicate content sur ton site. En plus du problème des liens mentionnés par Captain, tu as également un souci avec l'accès avec ou sans www. ++ Patrick
Arlette Posté 14 Octobre 2009 Posté 14 Octobre 2009 Bien vu Arlette ! Faites péter le champagne ! 6 ans de lecture pour enfin pouvoir répondre quelque chose de sensé et avoir la reconnaissance d'un pro ! ... Patrick, je le mets au frais. On fêtera l'événement ! Arlette commence à comprendre quelque chose au webmastering !
Dimitri Posté 14 Octobre 2009 Auteur Posté 14 Octobre 2009 Effectivement, beaucoup d'urls différentes semblent mener à ta page d'accueil, il faudrait corriger ça :/>http://www.hycity-car.com/?maf=12&sjt=6/>http://www.hycity-car.com/?maf=&page=12/>http://www.hycity-car.com/?pagecat=3 (etc) En fait ces urls datent de la première version de mon site. Pour passer dans la nouvelle version plus propre, j'ai traité toutes les pages qui n'existaient plus selon une redirection vers la page d'accueil. Il faudrait que je puisse supprimer les pages de l'index google qui n'ont plus lieu d'être donc... il y a une technique car je n'ai pas vu cela dans les outils webmaster google ou alors je suis passé à côté. Nota : j'ai une balise "canonical" pour bien mettre que tout ce qui touche à la page d'accueil a une url principale en http://www.hycity-car.com/ tu as également un souci avec l'accès avec ou sans www. Par contre je ne comprend pas cette remarque, pouvez-vous expliciter le sujet ? Merci déjà pour vos différents retours
captain_torche Posté 14 Octobre 2009 Posté 14 Octobre 2009 Patrick veut dire que chaque page est en doublon, vu qu'elle est accessible par www.tondomaine/page et par tondomaine/page Quant aux "redirections", elles ne sont apparemment pas actives: elles affichent bien toutes la page d'accueil, mais elles n'ont pas d'en-tête 301. Elles sont donc toutes en doublon.
Leonick Posté 14 Octobre 2009 Posté 14 Octobre 2009 j'ai remarqué, de temps à autres, que la page et la date affichées lors de la visualisation du cache des SERP ne correspondait pas du tout aux requêtes ayant menées à ce résultat : du genre une date de cache d'il y a 2 semaines alors qu'on fait une requête sur un terme qui n'a été ajouté que la veille sur cette page
thick Posté 15 Octobre 2009 Posté 15 Octobre 2009 Il faut bien comprendre que l'affichage par Google n'est pas toujours en coréllation avec la vérité dans l'index de Google. En l'occurrence, ce site est bien crawlé depuis les 20 derniers jours/>http://www.google.fr/#q=site:http://www.hycity-car.com+voiture+hybride+daterange:2455090-2455120&hl=fr&filter=0&fp=3873581dfbafc2df (voir l'opérateur "daterange") Par contre, une soumission dans les Google Webmaster Tools permettrait de visualiser les problèmes et régler pleins de paramètres essentiels.
Le-juge Posté 15 Octobre 2009 Posté 15 Octobre 2009 Je plussois avec Thick (qui a un nouvel avatar plus sympa ;op )
Dimitri Posté 15 Octobre 2009 Auteur Posté 15 Octobre 2009 Par contre, une soumission dans les Google Webmaster Tools permettrait de visualiser les problèmes et régler pleins de paramètres essentiels. Justement, dans le webmaster tools je n'ai aucune alerte, à part un duplicata de balises meta... Mais je viens de comprendre par rapport à ce qui est dit avant que mon routeur sur les anciennes adresses ne couvrent pas ces dernières par une redirection, j'ai un trou dans la raquette Je vais donc corriger cela. Par contre je ne vois pas comment gérer la question du WWW et sans WWW sur le nom de domaine. Dans les google tools j'ai bien spécifié que je voulais la forme avec les WWW. Y'a-t-il une technique spécifique
thick Posté 15 Octobre 2009 Posté 15 Octobre 2009 Pour la redirect, voici un code à mettre dans le .htaccess, à la racine du site. Le réglage dans GWT est uniquement cosmétique sur les résultats de recherche. Cela n'impacte pas comment tu configures ton site. RewriteEngine onRewriteCond %{HTTP_HOST} !www.tonsite.com$RewriteRule (.*) http://www.tonsite.com/$1 [QSA,L,R=301]
Le-juge Posté 15 Octobre 2009 Posté 15 Octobre 2009 Il me semble que la pluspart des hebergeur gere ce genre de trucs dans la console d'administration
thick Posté 16 Octobre 2009 Posté 16 Octobre 2009 Hmmm Dan pourra préciser, mais je crois que c'est assez dangereux de laisser cette manip au bon vouloir des hébergeurs. Me rappelle plus pour lequel, mais c'était vraiment mal fichu.
Le-juge Posté 16 Octobre 2009 Posté 16 Octobre 2009 2 hebergeurs ici proposent de gerer le problem dans la console d'administration Ca marche plutot pas mal, grosso modo c'est de la 301, ca va pas chercher midi a quatorze heure...
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant