Madrileño Posté 23 Novembre 2005 Posté 23 Novembre 2005 Voici un calcul rapide pour savoir le nombre de page et de sites a priori : Pour les sites utiliser la commande site: pour le savoir : http://www.google.com/search?q=site%3A 6,770,000,000 http://www.google.fr/search?q=site%3A 6 770 000 000 Résultats identiques entre le le suggest et le fr et aucun sous domaine présent... Pour savoir le nombre de page utiliser la lettre a : http://www.google.com/search?q=a 8,000,000,000 http://www.google.fr/search?q=a 8 660 000 000 je rappelle que le chiffre officiel est de : Searching 8,168,684,336 web pages Donc nous avons déjà 500 000 pages de plus que le chiffre officiel ... A savoir que suivant les data-centers le chiffre varie un peu ... Pour Yahoo maintenant : la commande site: bien-sur : http://search.yahoo.com/search?p=site%3A 160,000,000 http://fr.search.yahoo.com/search?p=site%3A 427 000 000 on remarque déjà un changement entre le fr et le us ... peut être une erreur direz vous ... Mais a priori la commande site: n'est pas forcément très pertinente suivant les moteurs a suivre ... En ce qui concerne la lettre a cela a l'air de bien continuer : http://search.yahoo.com/search?p=a 11,800,000,000 qui semble un chiffre réaliste ... http://fr.search.yahoo.com/search?p=a 11 400 000 000 Chiffre réaliste et qui continue de l'être entre le us et le fr ... A noter que la requête d'avant the ne marche plus pour savoir le nombre de page total ... Voyons maintenant avec MSN search : Avec la commande site: voyons : http://search.msn.com/results.aspx?q=site%3A 1,324,566,487 http://search.msn.fr/results.aspx?q=site%3A 1 357 146 730 Les chiffres sembles faibles quand même mais c'est le dernier moteur arriver ... Maintenant avec la lettre a : http://search.msn.com/results.aspx?q=a 2,473,264,711 http://search.msn.fr/results.aspx?q=a 2 620 164 127 Des chiffres assez bas et pas très concordant... A noter que les cotations en bourse sont disponibles en .com mais pas en .fr ... On peut donc voir que pour certains moteurs la lettre a peut être le résultat du nombre de page à peu près qu'ils disposent ( et on peux penser aussi que les pages trouvées sont celles qui sont en lettres comme nous écrivons ... et oui la chine n'utilise pas le a ) A noter que pour a sur : http://216.239.53.104/ http://216.239.57.104/ sont à : 8 610 000 000 et que pour : http://216.239.59.104/ http://66.102.11.104/ c'est à : 8 730 000 000 et pour : http://64.233.171.104/ http://64.233.179.104/ http://64.233.185.104/ sont à : 8 780 000 000 Une montée petit à petit de l'index peut être ... Pour ce qui est des sites cela peut être utile mais à savoir si le moteur ne prend pas en compte le mot seulement ou pas ... Ainsi j'ai donc chercher le nombre réel de page depuis la disparition du "the" ... Qu'en pensez-vous ? Si quelqu'un veut continuer à chercher pourquoi pas ps : l"utilisation de site: ne permet pas de savoir le nombre de site a mon avis mais pour le a il est probable comme je l'ai dit avant que cela soit un chiffre "potable" pour le nombre de pages indexés dans notre style de lettres... ps 2 : j'avais réaliser cette recherche il y a quelques temps : on peut noter que depuis le nombre de pages indexés par Google officiellement n'est plus leur priorité mais la pertinence comme au début. On peut ainsi voir des changement aussi entre l'étude et les résultats actuels mais il serait assez interessant de savoir la manière exacte de trouver le nombre de pages On note aussi le fait que certaines pages encore dans certains moteurs datent de quelques années ou mois et qui ne sont plus réelles ... Certains ont remarquer que msn des fois affiche plus de pages pour un site qu'il n'en contient mais on pourrait penser qu'il puisse s'agir de duplicate avec et sans www ... En fait je recherche plus d'informations sur le thème sur ce forum en complément aux informations que j'ai pu trouver et qui m'ont été fournies
Sebastien Posté 23 Novembre 2005 Posté 23 Novembre 2005 Une recherche négative sur un mot improbable donne des résultats supérieurs : http://www.google.com/search?hl=en&lr=&c2c...q=-fghxghxghxgh 6.68 milliards de pages affiché dans Google
Madrileño Posté 23 Novembre 2005 Auteur Posté 23 Novembre 2005 Une recherche négative sur un mot improbable donne des résultats supérieurs :http://www.google.com/search?hl=en&lr=&c2c...q=-fghxghxghxgh 6.68 milliards de pages affiché dans Google <{POST_SNAPBACK}> l'url m'affiche : 9,680,000,000 Etonnant d'ailleurs : -a : 2,100,000,000 -aa : 9,570,000,000 -aaa : 9,620,000,000 -aaaa : 9,670,000,000 -aaaaa : 9,680,000,000 et après ça ne bouge plus
Sebastien Posté 23 Novembre 2005 Posté 23 Novembre 2005 Oups j'ai fait une coquille, effectivement c'est bien 9,680,000,000 Tes requetes sur a, aa, aaa ne sont pas indiquées car ces mots existent vraiment.
Madrileño Posté 23 Novembre 2005 Auteur Posté 23 Novembre 2005 Oups j'ai fait une coquille, effectivement c'est bien 9,680,000,000 Tes requetes sur a, aa, aaa ne sont pas indiquées car ces mots existent vraiment. <{POST_SNAPBACK}> C'est bizarre quand même que autant de webmasters mettent alors aaa à la suite encore aa on peut faire une erreur mais aaa On voit de tout sur le web
Sebastien Posté 23 Novembre 2005 Posté 23 Novembre 2005 http://www.google.fr/search?sourceid=navcl...7,GGLD:en&q=aaa
Urban Posté 23 Novembre 2005 Posté 23 Novembre 2005 C'est bizarre quand même que autant de webmasters mettent alors aaa à la suite encore aa on peut faire une erreur mais aaa On voit de tout sur le web <{POST_SNAPBACK}> Pourquoi pas Sinon il y a aussi aaaaa, c'est pour les andouillettes (et maintenant le hub)
Anonymus Posté 23 Novembre 2005 Posté 23 Novembre 2005 C'est bizarre quand même que autant de webmasters mettent alors aaa à la suite encore aa on peut faire une erreur mais aaa On voit de tout sur le web <{POST_SNAPBACK}> Oui, tu as raison, ca doit être une erreur.. mais Elle est de taille => http://www.google.fr/search?hl=fr&c2coff=1...=cr%3DcountryFR Non ?
Madrileño Posté 24 Novembre 2005 Auteur Posté 24 Novembre 2005 Etonnant d'ailleurs :-a : 2,100,000,000 -aa : 9,570,000,000 -aaa : 9,620,000,000 -aaaa : 9,670,000,000 -aaaaa : 9,680,000,000 et après ça ne bouge plus <{POST_SNAPBACK}> Petit up : Suite à la série de aaaaaaaaa j'ai chercher à quel moment Google bugais ... Et surprise : Pour : -aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa Il y a 9 680 000 000 le même résultat que pour les requêtes avant depuis le -aaaaa on est d'accord ... Mais si on rajoute un a donc : -aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa On obtient déjà 9 690 000 000 et si on en rajoute un autre le chiffre revient à 9 680 000 000 et si je rajoute 8 "a" de plus : -aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa Tout marche bien et avec un de plus Google répond aucune réponse donc à 127 caractères plus "-" google ne répond pas a la requête Par contre il ne répond pas avec d'autres lettres mais pour -a quand on obtient 9 690 000 000 on n'a pas cette réponse avec les autres lettres à priori ... J'ai du mal a me comprendre mais je me comprends quelqu'un suis me comprend à par moi-même ?
Urban Posté 24 Novembre 2005 Posté 24 Novembre 2005 (modifié) En même temps ce n'est que des aproximations. En tapant sur google.fr : -gfrsegsdrtgsdgrgfsdrfqsdfrqdsf j'ai 9 660 000 000 pages avec : -aaaaa j'ai également 9 660 000 000 pages pourtant si je tape gfrsegsdrtgsdgrgfsdrfqsdfrqdsf je n'ai aucune page, si je tape aaaaa j'en ai 2 460 000 Cela dit 2 460 000 pages, ça ne fait que 0,025% d'erreur Modifié 24 Novembre 2005 par Urban
Régis Posté 24 Novembre 2005 Posté 24 Novembre 2005 Bonjour "Madrileño", Ton étude me rappelle étrangement ce que nous pouvons lire dans ce post : Requête "spéciale" sur Google du 28/03/05... et de l'utilisation de la commande "-asdf*(***)...." ou autre. Un outil permettait à l'époque de "visualiser" : "Star Tester" ou quelque chose du genre... De mémoire, je n'ai lu que des supputations sur ce phénomène... et beaucoup d'encre coulée...
Madrileño Posté 24 Novembre 2005 Auteur Posté 24 Novembre 2005 Bonjour "Madrileño", Ton étude me rappelle étrangement ce que nous pouvons lire dans ce post [...] et de l'utilisation de la commande "-asdf*(***)...." ou autre. <{POST_SNAPBACK}> En fait ce n'est pas pareil l'un permettait de savoir si un site était sandboxer et ici c'est plus pour savoir le nombre de pages entièrement indexés par les moteurs On remarque bien qu'au début du post l'étude était sur la commande site ou la lettre a tout simplement Pour les negatifs cela est venu par les échanges et montrent qu'il y a d'autres astuces à tester
Madrileño Posté 30 Décembre 2005 Auteur Posté 30 Décembre 2005 (modifié) Le retour de la requête "the" ... Et oui depuis quelques temps on peut voir un retour de la fameuse requete "the" qui affichait le nombre de pages indexés ... Vous allez être même étonner pour ceux qui ne le savent pas encore ... => Recherche de base en utilisant la toolbar : http://www.google.fr/search?q=the = 8 650 000 ... Recherche sur Google Suggest : http://www.google.com/search?complete=1&hl=en&lr=&q=the = 8 650 000 Recherche sur un des derniers datacenter : http://64.233.179.104/search?q=the = 23 160 000 000 Vous n'avez pas rêver ... 23 Milliards 160 Millions de pages indexés par Google Soit en 1 an le double de ce qu'ils avaient ... Cela me rapelle l'évolution informatique qui aujourd'hui ne suis plus le modèle de base ( par contre je n'arrive plus à me rapeller qui avait sorti la théorie ... merci d'avance ) Modifié 30 Décembre 2005 par Madrileño
wullon Posté 30 Décembre 2005 Posté 30 Décembre 2005 On peut même faire péter les 25 milliards : http://64.233.179.104/search?hl=fr&q=-aaaa...=Rechercher&lr= . Etrange ce DC...
Madrileño Posté 30 Décembre 2005 Auteur Posté 30 Décembre 2005 Les urls m'affichent maintenant les resultats d'avant ... Bizarre ... Google voudrait-il cacher le nombre de pages indexés volontairement ?
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant