Aller au contenu

Sujets conseillés

Posté

Voici un message d'erreur affiché par les serveurs délivrant les pages de cache de Google, rapporté par un membre du forum anglophone Digitalpoint :

pacemaker-alarm-delay-in-ms-overall-sum 2341989

pacemaker-alarm-delay-in-ms-total-count 7776761

cpu-utilization 1.28

cpu-speed 2800000000

timedout-queries_total 14227

num-docinfo_total 10680907

avg-latency-ms_total 3545152552

num-docinfo_total 10680907

num-docinfo-disk_total 2200918

queries_total 1229799558

e_supplemental=150000 --pagerank_cutoff_decrease_per_round=100 --pagerank_cutoff_increase_per_round=500 --parents=12,13,14,15,16,17,18,19,20,21,22,23 --pass_country_to_leaves --phil_max_doc_activation=0.5 --port_base=32311 --production --rewrite_noncompositional_compounds --rpc_resolve_unreachable_servers --scale_prvec4_to_prvec --sections_to_retrieve=body+url+compactanchors --servlets=ascorer --supplemental_tier_section=body+url+compactanchors --threaded_logging --nouse_compressed_urls --use_domain_match --nouse_experimental_indyrank --use_experimental_spamscore --use_gwd --use_query_classifier --use_spamscore --using_borg"

Ce message contient de nombreux paramètres intrigants... Notamment la mention du "spamscore", de "l'indyrank" et du "borg".

Par contre, je précise tout de suite que le avg-latency-ms est un paramètre hardware(temps de latence moyen en millisecondes), et non une allusion à l'algo LSI comme cela commence à se répandre dans les forums anglo saxons.

Je n'ai pas réussi à voir le message d'erreur en première main, donc je pense qu'il manque des infos de contexte pour statuer sur le caractère utile ou non des indications données par ce message pour le référencement ou la compréhension de l'algo de google

Posté

Effectivement

Il serait intéressant de connaître l'URL de la page en cache ainsi que la date ;) cela pourrait être un très vieux cache de plus d'un an en résultat complémentaire.

Même si on commence à connaître ce que peut mesurer GG, on ne connait pas la valeur des filtres appliqués. :(

Jeff,

Posté (modifié)
Il serait intéressant de connaître l'URL de la page en cache ainsi que la date ;)

Cela permettrait de s'assurer qu'il ne s'agit pas d'un canular. :shutup:

Modifié par KaRaK
Posté
Cela permettrait de s'assurer qu'il ne s'agit pas d'un canular.

D'après ce que j'ai pu en lire... pour quelques-uns, c'est un canular car ils n'arrivent pas à retrouver cette fameuse page en cache...

A suivre...

Posté

En fait, c'était un message d'erreur renvoyé par les serveurs chargés de délivrer les pages en cache.

Vu le message, cela dénote un problème hardware ou un pb de surcharge des serveurs.

Donc c'est normal que Google ait fini par régler ce problème et que le message ait disparu...

Pas facile de savoir si c'est du flan tant que personne n'a réussi à reproduire le phénomène.

Posté

Donc Matt Cutts confirme que c'est un vrai message d'erreur. Dans ce cas, on peut s'attarder deux secondes sur ce qu'on y apprend...

Déjà une confirmation : en fait google est une entité mi homme mi machine, et seul l'équipage de l'Enterprise peut nous sauver : les "borgs" sont dans l'algorithme (Capitaine Picard, au secours !) . ;)

Trève de plaisanterie, deux hypothèses concernant ce point : il s'agit d'une fonctionnalitée baptisée "borg" en l'honneur d'Anita Borg, ou en référence aux cyborgs dans Star Trek. Il semble que la deuxième hypothèse ait quelques fondements, car il traine sur le net des indices de l'existence d'un "centre serveur" interne à google qui porte ce nom.

Par ailleurs, gwd fait allusion au "Google Web Directory" (Dmoz) : j'ai lu pas mal d'interprétations fantaisistes à mon avis sur l'acronyme.

On voit apparaître également pour la première le terme "indyrank" : qu'est-ce que cela peut-être ? Indy est un préfixe qui peut correspondre à plusieurs choses, mais l'hypothèse "indy"="independent" me séduit. Maintenant, ce serait un rank indépendant de quoi ?

Le terme spamscore est intéressant : cela confirme que Google utilise bien une note spéciale pour éliminer les sites spammy. Et en plus, on apprend que cette note mesure un "niveau de spam" et non un "niveau de confiance" (l'inverse, comme dans le trustrank)

Le "pagerank cutoff" résiste encore à mon analyse, j'ai une vague idée mais je cherche dans la littérature à quoi cela peut bien correspondre...

Posté

Merci pour tes interprétations cariboo.

J'ai bien aimé le faux paramètre pigeonrank_seed :)

Dans les commentaires, Matt dit qu'il va s'exprimer prochainement sur le spammeur et ses 5 milliards de pages indexées dont nous avons parlé il n'y a pas très longtemps sur le Hub.

Posté

Tiens une autre supposition :

prvec4 = vecteur du pagerank calculé par extrapolation quadratique

prvec = vecteur "normal"...

Posté (modifié)

Difficile de trouver des infos sur l'indyrank. C'est pourtant la ligne qui m'a sauté aux yeux et je pensais que cette variable mettrait en émoi la

communauté des webmasters, et ce, malgrè la présence du nouse.

Le terme spamscore est intéressant : cela confirme que Google utilise bien une note spéciale pour éliminer les sites spammy. Et en plus, on apprend que cette note mesure un "niveau de spam" et non un "niveau de confiance" (l'inverse, comme dans le trustrank)

Il m'est difficle de penser que Google ne prend pas du tout en compte (même sans l'utiliser dans son algo) l'effet Trustrank, non mentionné dans le message d'erreur.

Et si l'indyrank n'était ni plus ni moins que le trustrank ?

Modifié par mr_go

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...