Aller au contenu

Sujets conseillés

Posté

Pour répondre aux quelques 200 millions de requêtes quotidiennes, Google a réparti sa puissance de calcul sur 10 centres appelés Datacentres, dispersés géographiquement sur la planète (en majorité aux USA tout de même)

Ces centres comprennent chacun plusieurs milliers de PC en réseau... une très grosse structure car sans avoir de données précises, on estime le nombre d'ordinateurs utilisés pas Google à 50 000 ... de quoi chauffer une petite ville.

Lorsqu'on interroge google.com ou n'importe quelle version locale de l'index comme google.fr, la requête est redirigée vers l'un de ces centres en fonction de la situation géographique de l'internaute et de la charge du réseau.

Un article du Hub explique ce mécanisme nommé Round Robin: Le Round Robin DNS

De par le passé, Google faisait des mises à jours mensuelles de ses index, et vu le nombre d'ordinateurs impactés ne pouvait pas le faire instantanément.

Il commençait donc avec tous les ordinateurs d'un DataCentre (au hasard) et une fois l'index à jour, le propageait vers les autres, en séquence.

Cette propagation prenait un peu moins d'une semaine et pendant cette semaine, en fonction du DataCentre vers lequel les recherches étaient redirigées par le Round-Robin ("index à jour" ou "index ancien"), les résultats pouvaient varier à intervalle de quelques minutes. On disait alors que "Google dansait", vu l'instabilité apparente de ses résultats.

Cette expression est restée sous le nom de "Google Dance". (avec un C en anglais)

Depuis peu, Google fait une mise à jour de ses index quasiment "en continu" ce qui a créé pas mal de remous chez les webmasters ces derniers mois.

L'avantage de cette approche est qu'un nouveau site peut se trouver dans l'index bien plus vite qu'avant... l'inconvénient est qu'il reste toujours une partie assez lourde de recalcul de "l'importance des pages" (le PageRank) que Google doit effectuer à intervalle régulier.

Il semble que la période s'établisse autout de 15 jours, et on appelle cela une "mini Google Dance" car le positionnement varie moins qu'avant comme tous les index sont à peu près synchronisés en continu.

Cette phase de calcul est principalement utilisée pour calculer la "popularité" (l'importance selon Google) d'un site, en se basant sur l'algorithme du PageRank.

En quelques mots: il faut que pour chaque page de l'index (près de 4 milliards), Google calcule le nombre de pages émettant un "vote" (un lien) vers celle-ci. Le résultat donnera une idée de la popularité de la page, qui est un des critères servant à classer les résultats de recherche. Mais là c'est une autre histoire... ;)

Quelques articles sur le Hub expliquent le "PageRank" nous conseillons à ceux qui ne sont pas familiers avec cette notion de commencer par le premier de la série: Le PageRank par l'exemple, c'est le plus "digeste". ;)

  • 1 year later...
  • 2 semaines plus tard...
Posté

Salut à tous,

Effectivement, le post de Dan date un peu...

Surtout en ce qui concerne les DC Google. Pour ma part, j'en référence beaucoup plus. Leur localisation semble toujours mystérieuse pour les "non-google".

Mais c'est tellement passionant de pouvoir mettre un nom sur ces fameux centres.

Vous en êtes ou sur le Hub ?

Kendos

Posté

Il en existe beaucoup plus que ce qui est listé dans la partie 'outils' du hub, mais le principe n'est pas forcément de les lister tous, mais de mettre un échantillon représentatif.

Posté

La question n'est pas de savoir si les informations de Dan datent trop....

Dan évoque certaines informations à une date donnée certes, et elles sont tout de même "à prendre en compte" parce que sérieuses....

Mais, la question que l'on doit se poser :

"Qui sait vraiment où en est GG" ?????

Je dirai même, à la manière Gasconne... Bigre de Diou qu'est ce qu'il fabrique....

Sur ce point soyons tous très modestes....

La réponse est : Personne ne sait.... personne....

Et peut être même pas ceux de GG.... parce qu'il y aurait peut être des fuites... n'est ce pas ?

Ne vous étonnez pas, c'est une simple question......

  • 3 semaines plus tard...
Posté

Bonjour

J'aurais une question. Quand le positionnement d'un site n'est pas aligné sur tous les datacenters, peut on savoir QUEL datacenter est "le bon", c'est à dire celui qui indique la position réelle que l'on devrait avoir une fois que tous les datacenters seront alignés?

Par exemple, selon les datacenters, mon site est soit 9eme soit 11eme, puis je savoir si dès qu'ils seront tous alignés je serais 11eme ou 9eme?

Merci d'avance

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...