Aller au contenu

Sujets conseillés

Posté

Bonjour,

j'ai lancé un nouveau site il y a 3 semaines : j'ai donc mis 2 liens sur 2 pages d'accueil différentes de sites indépendants à PR4, ces pages d'accueil n'ont pratiquement pas de liens sortants (des liens internes), et Google qui visitait tous les jours ou tous les 2 jours ces pages d'accueil n'y va plus !

Non seulement le site lié est inconnu de tous les data centers, mais de plus, le texte des liens est lui aussi inconnu !

Je ne comprends pas ce qui se passe en ce moment, GG fait une grève ou quoi ?

Avez vous le même problème avec vos nouvelles pages par exemple ?

Posté

Ce problème existe sur beaucoup de sites. Google est très lent depuis Big daddy, et semble même vouloir ignorer certaines nouvelle pages.

Officiellement, Matt Cutts explique que le fonctionnement des bots à changé (voir ce topic) et Googleguy toujours aussi enigmatique indique que "Bigdaddy will have different crawl priorities" (cf wmw).

Officieusement il se dit de plus en plus que ce ralentissement des crawls est le signe d'un problème chez Google.

Malheureusement, il n'y a pas grand chose d'autre à faire que d'attendre.

Posté

Je n'ai vu accune difference sur mon propre site : il me semble que googlebot est passe en debut de semaine, et googlebot-image est en trains de crawler mon site.

Posté

J'ai excatement le même problème que Campagne........

Ca nous arrange pas beaucoup

En même temps, GG n'a jamais fait grand chose pour nous arranger :whistling:

et pourtant exactement l'inverse s'est produit en mars : indexé, PR de 4 d'un coup sur des sites qui avaient 4 semaines alors......

+1 pour la patience

Posté

Cela commence à m'inquiéter aussi : sur mon site Google à visité 20 517 pages en mars, et seulement 566 pages en avril....

Heureusement que le nombre de visiteurs qu'il m'envoie n'a pas autant chuté... mais il m'a quand même envoyé 10% de visiteur en moins en avril par rapport à mars alors que les mois précédents j'avais une augmentation régulière de 20% chaque mois...

Posté

Avril est aussi un mois de vacances... ne l'oublions pas.

Cela a pû faire varier la fréquentation des sites dans des proportions non négligeables.

Posté (modifié)

Personnellement j'ai un site qui n'a pas été crawlé par GG depuis le 8 avril ! C'est 1 site qui a plus d'1 an et demi (PR3) et bien qu'il soit sandboxé, il apparait dans 80% des Datacenters et plusieurs BL externes pointent sur lui.

J'ai entendu dire que GG appliquait parfois sur certains sites (mais rarement) des sanctions extreme NCL (no crawl list) mais que celles-ci ne s'appliquait que pour les sites blaklistés ... :unsure:

J'avoue ne plus savoir trés bien que penser de tout cela !

Modifié par Calimero
Posté (modifié)

je viens d'enlever le robot.txt, mais je ne pense pas qu le pb vienne de la:

User-Agent:*

Disallow:/pages/

je voulais simplement signaler aux moteurs de ne pas crawlé le rep "pages". :nono:

Pour répondre à ta question je n'utilise aucun outil...

Modifié par Calimero
Posté

Bonjour Calimero,

Si tu n'utilises aucun outil, comment peux-tu être sûr qu'il n'est plus crawlé ? Tu as épluché tes logs ?

Les robots lisent le fichier robots.txt et le contenu que tu as indiqué interdit uniquement la visite du répertoire /pages/ comme tu le dis. Donc pas de mauvaise surprise à craindre de ton fichier robots.txt.

Jean-Luc

Posté

Bonjour Jean Luc

oui merci pour la correction: mon clavier a fourché! :)

Si j'en crois mes stats Awstats , 5 pages ont été crawlé ce matin!!!

Le pb c'est que 1) le cache GG indique que la derniere visite de mon site date du 8 avril et 2) j'ai changé la partie meta description et le "title" depuis et ceci n'a toujours pas été pris en compte..

Je constate qu'à chaque fois que je regarde mes stats (surtout par rapport aux passages des bots) cela ne colle jamais alors maintenant je ne me fie plus aux stats (y en a marre :angry: ) ... Tu me diras le bot est passé par les fenetres: je veux bien , mais alors pourquoi il n'est pas passé par la porte vu que tous mes liens externes pointent vers mon index??????????

Euh dsl je commence à perdre les pédales... :fou:

PS: Je précise que Yahoo ou msn eux ont bien indexé mes modifs...

Posté
Si j'en crois mes stats Awstats , 5 pages ont été crawlé ce matin!!!

L'ennui, c'est que comme ceci, tu ne sais pas quelles pages ont été visitées par Googlebot. Malgré tout, il est probable que la page d'accueil ait été visitée. Dans ce cas, encore 48 heures de patience et le cache devrait être à jour (24 heures si tu as de la chance et XXX heures si tu n'en a pas.... Les voies de Google sont impénétrables... :wacko:

Jean-Luc

Posté

Le problème n'est pas le crawl car même si le Bot passe sur les pages il traîne carrément pour les rentrer dans l'index. La rumeur dit que Google tourne à pleine capacité au niveau des serveurs et les choses devraient rentrer dans l'ordre quand l'infrastructure sera complètement mise à jour.

Bref, comme dit Jan il faut attendre :(

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...