Aller au contenu

Sujets conseillés

Posté

Bonjour, afin d'améliorer mon site, j'ai installé Wordpress sur un nom de domaine bidon, et je poste sur ce blog des billets dont le contenu n'a absolument aucun intérêt, si ce n'est de me permettre d'évaluer les performances de Wordress.

J'ai créé un petit script qui enregistre toutes les visites de Googlebot dans un fichier, cela me permet de mesurer les temps qui s'écoulent entre la publication d'un billet et l'exploration de celui-ci par Googlebot.

Les résultats sont hallucinants, en temps normal (pas de mise à jour), Googlebot passe une dizaine de fois sur mon blog (il visite les articles, les tags...). Mais dès que je publie un nouveau billet, il vient explorer mon flux RSS et ma page d'accueil (toujours dans cet ordre, à quelques secondes d'intervalle) dans les 2 minutes qui suivent la publication !

C'est seulement une quinzaine de minutes après la publication de l'article que Googlebot visite la page du billet. C'est après ce délai que je vois mon billet dans les SERP.

Alors forcément ça attise ma convoitise, je voudrais comprendre comment Wordpress arrive à donner de si bons résultats (mon site a bien plus de pages et de trafic, mais ça met parfois 24 heures pour l'indexation des nouvelles pages).

Ce n'est pas par hasard que Googlebot vient explorer mon blog pile au moment ou je publie des articles (comme je l'ai dit, en temps normal GG ne passe que quelques fois par jour), je vois donc deux façons d'expliquer ça :

  • Soit Wordpress est capable de prévenir Google lors des mises à jour (ça serait un peu gros quand même, je privilégie la seconde hypothèse)
  • Googlebot explore mon site bien plus souvent que 10 fois par jour, mais ces requêtes fréquentes ne sont pas loggés dans mon fichier (une sorte de requête légère quoi)

De plus, à chaque fois c'est le flux RSS et la page d'accueil qui sont explorés en premier, j'ai donc regardé dans le <head> de la home et j'y ai trouvé des choses bizarres :

<link rel="pingback" href="/xmlrpc.php" />
<link rel="EditURI" type="application/rsd+xml" title="RSD" href="/xmlrpc.php?rsd" />
<link rel="wlwmanifest" type="application/wlwmanifest+xml" href="/wp-includes/wlwmanifest.xml" />

Ça pourrait aussi être le <updated>2008-10-08T17:29:14Z</updated> de mon flux ATOM...

Bref je suis dans le brouillard, mais je sens que j'ai mis le doigt sur quelque chose qui vaut le détour...

Merci de m'éclairer

Posté

Bonsoir,

Est ce que le fait de pinguer propose à google d'indexer le répertoire wp-content aussi?

Car je rencontre ce souci récemment, je me suis lancé pour la première fois dans le blogging (un bien grand mot ^^) j'ai écrit un article et depuis a mise en ligne de ce blog, google a tout indexer, meme le répertoire des plugins, ... Je comprends pas trop, j'avais jamais vu ça avant...

http://www.google.fr/search?hl=fr&q=si...rabek.fr%2Fblog

Une explication...?

Merci :)

Posté

Salut

Moi aussi sur un Wordpress, Google m'a indexé des fichiers de configuration et de fonctions.

Par chance, ils n'apparaissent qu'avec la commande "site:" et pas lors de recherches "normales".

Solution simple: après avoir vérifié qu'aucun lien ne pointait vers ces fichiers (mais comment diable Google les a-t-il trouvé?) j'ai simplement stoppé l'indexation de ces fichiers via robots.txt

(et effectivement, les moteurs aiment beaucoup Wordpress. Je ne m'en plains pas.)

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...