campagne Posté 28 Avril 2006 Posté 28 Avril 2006 Bonjour, j'ai lancé un nouveau site il y a 3 semaines : j'ai donc mis 2 liens sur 2 pages d'accueil différentes de sites indépendants à PR4, ces pages d'accueil n'ont pratiquement pas de liens sortants (des liens internes), et Google qui visitait tous les jours ou tous les 2 jours ces pages d'accueil n'y va plus ! Non seulement le site lié est inconnu de tous les data centers, mais de plus, le texte des liens est lui aussi inconnu ! Je ne comprends pas ce qui se passe en ce moment, GG fait une grève ou quoi ? Avez vous le même problème avec vos nouvelles pages par exemple ?
Jan Posté 28 Avril 2006 Posté 28 Avril 2006 Ce problème existe sur beaucoup de sites. Google est très lent depuis Big daddy, et semble même vouloir ignorer certaines nouvelle pages. Officiellement, Matt Cutts explique que le fonctionnement des bots à changé (voir ce topic) et Googleguy toujours aussi enigmatique indique que "Bigdaddy will have different crawl priorities" (cf wmw). Officieusement il se dit de plus en plus que ce ralentissement des crawls est le signe d'un problème chez Google. Malheureusement, il n'y a pas grand chose d'autre à faire que d'attendre.
destroyedlolo Posté 28 Avril 2006 Posté 28 Avril 2006 Je n'ai vu accune difference sur mon propre site : il me semble que googlebot est passe en debut de semaine, et googlebot-image est en trains de crawler mon site.
sébastien971 Posté 28 Avril 2006 Posté 28 Avril 2006 J'ai excatement le même problème que Campagne........ Ca nous arrange pas beaucoup En même temps, GG n'a jamais fait grand chose pour nous arranger et pourtant exactement l'inverse s'est produit en mars : indexé, PR de 4 d'un coup sur des sites qui avaient 4 semaines alors...... +1 pour la patience
Pixame Posté 29 Avril 2006 Posté 29 Avril 2006 Cela commence à m'inquiéter aussi : sur mon site Google à visité 20 517 pages en mars, et seulement 566 pages en avril.... Heureusement que le nombre de visiteurs qu'il m'envoie n'a pas autant chuté... mais il m'a quand même envoyé 10% de visiteur en moins en avril par rapport à mars alors que les mois précédents j'avais une augmentation régulière de 20% chaque mois...
Dan Posté 29 Avril 2006 Posté 29 Avril 2006 Avril est aussi un mois de vacances... ne l'oublions pas. Cela a pû faire varier la fréquentation des sites dans des proportions non négligeables.
Calimero Posté 4 Mai 2006 Posté 4 Mai 2006 (modifié) Personnellement j'ai un site qui n'a pas été crawlé par GG depuis le 8 avril ! C'est 1 site qui a plus d'1 an et demi (PR3) et bien qu'il soit sandboxé, il apparait dans 80% des Datacenters et plusieurs BL externes pointent sur lui. J'ai entendu dire que GG appliquait parfois sur certains sites (mais rarement) des sanctions extreme NCL (no crawl list) mais que celles-ci ne s'appliquait que pour les sites blaklistés ... J'avoue ne plus savoir trés bien que penser de tout cela ! Modifié 4 Mai 2006 par Calimero
petit-ourson Posté 4 Mai 2006 Posté 4 Mai 2006 Vous contrôlez le passage à partir d'outil internet ou externe ? ip ou user-agent ?
Calimero Posté 4 Mai 2006 Posté 4 Mai 2006 (modifié) je viens d'enlever le robot.txt, mais je ne pense pas qu le pb vienne de la: User-Agent:* Disallow:/pages/ je voulais simplement signaler aux moteurs de ne pas crawlé le rep "pages". Pour répondre à ta question je n'utilise aucun outil... Modifié 4 Mai 2006 par Calimero
Jeanluc Posté 4 Mai 2006 Posté 4 Mai 2006 Bonjour Calimero, Si tu n'utilises aucun outil, comment peux-tu être sûr qu'il n'est plus crawlé ? Tu as épluché tes logs ? Les robots lisent le fichier robots.txt et le contenu que tu as indiqué interdit uniquement la visite du répertoire /pages/ comme tu le dis. Donc pas de mauvaise surprise à craindre de ton fichier robots.txt. Jean-Luc
Calimero Posté 4 Mai 2006 Posté 4 Mai 2006 Bonjour Jean Luc oui merci pour la correction: mon clavier a fourché! Si j'en crois mes stats Awstats , 5 pages ont été crawlé ce matin!!! Le pb c'est que 1) le cache GG indique que la derniere visite de mon site date du 8 avril et 2) j'ai changé la partie meta description et le "title" depuis et ceci n'a toujours pas été pris en compte.. Je constate qu'à chaque fois que je regarde mes stats (surtout par rapport aux passages des bots) cela ne colle jamais alors maintenant je ne me fie plus aux stats (y en a marre ) ... Tu me diras le bot est passé par les fenetres: je veux bien , mais alors pourquoi il n'est pas passé par la porte vu que tous mes liens externes pointent vers mon index?????????? Euh dsl je commence à perdre les pédales... PS: Je précise que Yahoo ou msn eux ont bien indexé mes modifs...
Jeanluc Posté 4 Mai 2006 Posté 4 Mai 2006 Si j'en crois mes stats Awstats , 5 pages ont été crawlé ce matin!!! L'ennui, c'est que comme ceci, tu ne sais pas quelles pages ont été visitées par Googlebot. Malgré tout, il est probable que la page d'accueil ait été visitée. Dans ce cas, encore 48 heures de patience et le cache devrait être à jour (24 heures si tu as de la chance et XXX heures si tu n'en a pas.... Les voies de Google sont impénétrables... Jean-Luc
thick Posté 5 Mai 2006 Posté 5 Mai 2006 Le problème n'est pas le crawl car même si le Bot passe sur les pages il traîne carrément pour les rentrer dans l'index. La rumeur dit que Google tourne à pleine capacité au niveau des serveurs et les choses devraient rentrer dans l'ordre quand l'infrastructure sera complètement mise à jour. Bref, comme dit Jan il faut attendre
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant