IceDev Posté 8 Août 2005 Posté 8 Août 2005 (modifié) Bonsoir à tous, Ca va faire quelques semaines maintenant que j'essaie vainement de faire apparaître le site d'un client sur Google. Le site ne dispose à la base que de quelques pages accessibles au public non enregistré (5-6), mais j'ai optimisé ces pages en suivants les conseils de Wri (ajout de textes ciblés, de balises metas, importance des alt et title des images et liens, soumissions du site sur plus d'une centaine d'annuaires, etc). Rien n'y fait, alors que le site apparaît sans trop de mal sur les autres outils de recherches sur les mots-clés qui m'intéresse, il n'apparaît toujours pas sur Google. Je me pose alors plusieurs questions : - Pendant près d'un mois, le nom de domaine du site pointait sur une page d'un compte Free sans contenu, meta ni liens. Mes difficultés à indexer le site viendraient elles de là ? - Cela peut il venir de l'impossibilité du moteur à crawler toutes les pages ? Dans ce cas de figure dois-je mettre en place un fichier robot.txt ou tout auter méthode de ce genre pour indiquer au robot les pages qui lui sont autorisées (ce qui n'est actuellement pas du tout le cas) - Le site sort tout de même sur Google via une campagne adwords. Celle-ci pourrait-elle interférer avec le référencement naturel du site ? Voici l'adresse du site, si vous avez un début d'explication sur ce 'blocage' de Google, je suis preneur : http://www.databike.com Je précise qu'une bonne partie du site (80% du contenu) n'est pas accessible à un utilisateur non inscrit (et n'est donc pas accessible aux bots des moteurs de recherche). Je me demande si cela ne peut pas être un facteur bloquant, si Google se casse trop les dents à essayer de suivre mes liens. Mais cela n'a semble t'il pas posé de problèmes à Yahoo et Msn. Modifié 8 Août 2005 par IceDev
Portekoi Posté 8 Août 2005 Posté 8 Août 2005 Bonjour, Je ne pense pas que cela soit ca mais essaie de 'rangr' ton code javascrpit dans des fichiers js. Par exemple, la fonction 'openBrWindow' apparait 3 fois dans ton code alors qu'une seule fois suffirait Portekoi PS : Sympa ton site sinon
dièse Posté 8 Août 2005 Posté 8 Août 2005 Bonjour, C'est effectivement très bizarre que ton site ne soit pas indéxé du tout par Google. Peut-être que des personnes sur ce forum vont pouvoir t'aider, pour ma part tout ce que je peux te dire c'est que tes problème ne viennent ni de l'impossibilité du moteur à crawler toutes les pages ni des campagnes adwords, pour le reste... Essaie peut-être le formulaire de soumission manuel, on ne sait jamais
IceDev Posté 8 Août 2005 Auteur Posté 8 Août 2005 Justement, le hic c'est que j'ai commencé par là, il y a maintenant deux mois, et je l'ai re-soumis il y a 2-3 semaines, avec toujours aucun changement.
Dan Posté 8 Août 2005 Posté 8 Août 2005 Salut Icedev, C'est là qu'on se rend compte que les outils du Hub sont parfois bien utiles En mettant l'URL de ton site dans le http-viewer, on obtient ceci: URL: http://www.databike.com/HTTP/1.1 200 OK Date: Mon, 08 Aug 2005 14:12:00 GMT Server: Apache/1.3.33 (Unix) PHP/4.4.0 X-Powered-By: PHP/4.4.0 Set-Cookie: PHPSESSID=2ad9edf31cd8efd227326016a858c0a3; path=/ Expires: Thu, 19 Nov 1981 08:52:00 GMT Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0 Pragma: no-cache Connection: close Content-Type: text/html C'est l'identifiant de session qui coince avec Google. Chez GG, c'est rédhibitoire d'avoir des identifiants de session dans les URLs. Il suffirait simplement de ne faire le session_start() que lorsqu'aucun moteur n'est identifié, par exemple (liste de moteurs à éditer): /* Ouverture de session conditionnelle, pas pour les robots identifies */// Spider/Bot pour référencement $spiders = array( "Googlebot", "crawler", "Slurp", "Fast", "ia_archiver", "Scooter", "Robot", "VoilaBot", "W3C", "ZyBorg", "Deepindex", "xecho" ); $from_spider = false; foreach($spiders as $Val) { if (eregi($Val, $_SERVER["HTTP_USER_AGENT"])) { $from_spider = true; break; } }// Session ini_set("session.use_trans_sid", "0");if(!$from_spider) { session_start();}
Arlette Posté 8 Août 2005 Posté 8 Août 2005 Je ne suis pas une experte, mais n'aurais-tu pas sur-optimisé ton site et celui-ci ne serait-il pas blacklisté ? Si j'en crois l'outil du Hub tu n'as aucune page, ni aucun lien chez google. C'est bizarre que les autres moteurs arrivent a te trouver et pas google. Que tu sortes avec les adwords c'est normal vu que tu paies J'espère pour toi que je me trompe . Je laisse le clavier aux spécialistes. <edit : Zut, Dan m'a scotchée... Je ne suis encore pas assez experte en outils du Hub >
IceDev Posté 8 Août 2005 Auteur Posté 8 Août 2005 Aie, il me semblait que le problème avec les PHPSESSID ne se posait que lorsque ce paramètre était passé en GET dans les URL. Si j'en crois ce que tu dis Dan, il s'agit d'un facteur bloquant même si le PHPSESSID passe simplement au niveau de l'entête http des pages. Si c'est le cas, oui là j'ai un bon début d'explication du pourquoi de l'invisibilité du site sur Google.
Arlette Posté 8 Août 2005 Posté 8 Août 2005 Si j'en crois ce que tu dis Dan, il s'agit d'un facteur bloquant même si le PHPSESSID passe simplement au niveau de l'entête http des pages. S'il est un seul membre ici dont tu ne peux pas mettre les réponses en doute c'est bien Dan . Donc tu peux modifier ton code les yeux fermés si je puis dire PS : Modifie comme il te le dit, et si ça marche pas, revient nous le dire : On le vire
IceDev Posté 8 Août 2005 Auteur Posté 8 Août 2005 (modifié) Oulalala non loin de moi l'idée de mettre en doute les compétences de Dan. Vu à quel point je galère sur le référencement de ce site sur Google, un commentaire comme celui-là je le prends au pied de la lettre et m'en vais courir faire vite fais les modifications qui s'imposent. :-D Modifié 8 Août 2005 par IceDev
Dan Posté 8 Août 2005 Posté 8 Août 2005 S'il est un seul membre ici dont tu ne peux pas mettre les réponses en doute c'est bien Dan Je peux me tromper comme tout le monde Mais pas dans ce cas-ci ! Le problème des identifiants de sessions c'est qu'il est passé dans l'URL dès lors que les cookies ne sont pas acceptés. Et c'est le cas pour tous les moteurs Dan
Portekoi Posté 8 Août 2005 Posté 8 Août 2005 Oulalala non loin de moi l'idée de mettre en doute les compétences de Dan. Vu à quel point je galère sur le référencement de ce site sur Google, un commentaire comme celui-là je le prends au pied de la lettre et m'en vais courir faire vite fais les modifications qui s'imposent. :-D Hop hop hop au pas de course et mets ton javascript dans un fichier js, ca fera plaisir à Google On est jamais trop gentil avec Google
Dan Posté 8 Août 2005 Posté 8 Août 2005 Hop hop hop au pas de course et mets ton javascript dans un fichier js, ca fera plaisir à Google C'est du Php, pas du Javascript
Portekoi Posté 8 Août 2005 Posté 8 Août 2005 Mais non Dan, relis mon premier post <!--function mmLoadMenus() { if (window.mm_menu_0330113023_0) return; window.mm_menu_0330113023_0 = new Menu("root",154,25,"Arial, Helvetica, sans-serif",11,"#FFFFFF","#FFFFFF","#2222AA","#8D9EDC","left","middle",3,1,100,-5,7,true,false,true,12,false,false); mm_menu_0330113023_0.addMenuItem("Présentation","location='#'"); mm_menu_0330113023_0.addMenuItem("Qui sommes-nous ?","location='#'"); mm_menu_0330113023_0.fontWeight="bold"; mm_menu_0330113023_0.hideOnMouseOut=true; mm_menu_0330113023_0.bgColor='#FFFFFF'; mm_menu_0330113023_0.menuBorder=1; mm_menu_0330113023_0.menuLiteBgColor='#FFFFFF'; mm_menu_0330113023_0.menuBorderBgColor='#FFFFFF'; window.mm_menu_0330113440_0 = new Menu("root",159,25,"Arial, Helvetica, sans-serif",11,"#FFFFFF","#FFFFFF","#8D9EDC","#AFBCE7","left","middle",3,1,100,-5,7,true,false,true,12,false,false); mm_menu_0330113440_0.addMenuItem("Les parcours","location='parcours.php'"); mm_menu_0330113440_0.addMenuItem("Votre profil","location='profil.php'"); mm_menu_0330113440_0.addMenuItem("Votre abonnement","location='abonnement.php'"); mm_menu_0330113440_0.addMenuItem("Votre événement","location='votre_evenement.php'"); mm_menu_0330113440_0.fontWeight="bold"; mm_menu_0330113440_0.hideOnMouseOut=true; mm_menu_0330113440_0.bgColor='#FFFFFF'; mm_menu_0330113440_0.menuBorder=1; mm_menu_0330113440_0.menuLiteBgColor='#FFFFFF'; mm_menu_0330113440_0.menuBorderBgColor='#FFFFFF'; mm_menu_0330113440_0.writeMenus(); } // mmLoadMenus() //--> <!--function MM_openBrWindow(theURL,winName,features) { //v2.0 window.open(theURL,winName,features); } IE = (document.all); NS = (document.layers); if (NS) document.captureEvents(Event.KEYPRESS); document.onkeypress = doEnterKey; //--> Etc.....
IceDev Posté 8 Août 2005 Auteur Posté 8 Août 2005 Au sujet des PHPSESSID, le responsable de la config des serveurs dans ma boîte m'a expliqué que même si les cookies ne sont pas acceptés, le PHPSESSID n'est pas envoyé en GET dans l'URL grâce à une conf Apache : session.use_trans_sid = 0 dans le php.ini du serveur. Doumentation session.use__trans_id
Dudu Posté 8 Août 2005 Posté 8 Août 2005 Salut, N'y aurait-il pas également un problème de redirection 302 ? Sur la requête "databike" Google renvoie le site databike.net en 4ème position. Il connait donc le .net et pas le .com, or tu redriges l'un vers l'autre par une 302 (quand on sait les problèmes qu'a Google avec les 302..) Sinon, j'ai essayé de naviguer sur ton site sans cookie ni JS: rien dans l'URL effectivement, mais beaucoup de liens deviennent inaccessibles car ils sont en Javascript.
klelugi Posté 8 Août 2005 Posté 8 Août 2005 Curieux que Google n'ait rien sur ton site effectivement... Par contre tu es bien présent sur yahoo! Mais je me demande si ce n'a pas à voir avec ta page d'accueil ? Au regard de la version en cache... http://216.109.124.98/search/cache?p=www.d...&icp=1&.intl=fr Car si c'est ce à quoi GG a eu droit peu être que ca viens de la, voir bas de page ?
Dan Posté 8 Août 2005 Posté 8 Août 2005 Au sujet des PHPSESSID, le responsable de la config des serveurs dans ma boîte m'a expliqué que même si les cookies ne sont pas acceptés, le PHPSESSID n'est pas envoyé en GET dans l'URL grâce à une conf Apache : session.use_trans_sid = 0 dans le php.ini du serveur. Doumentation session.use__trans_id Ca c'est la théorie... et l'outil du Hub qui n'accepte pas les cookies démontre bien qu'elle est fausse, non ? Si les PHPSESSID ne sont pas transmis, pourquoi j'ai cette ligne alors ? Set-Cookie: PHPSESSID=2ad9edf31cd8efd227326016a858c0a3; path=/
Dan Posté 8 Août 2005 Posté 8 Août 2005 Au regard de la version en cache... http://216.109.124.98/search/cache?p=www.d...&icp=1&.intl=fr Car si c'est ce à quoi GG a eu droit peu être que ca viens de la, voir bas de page ? Clair que Google n'a pas dû aimer... trop de mots clés identiques=spamdexing ... @portekoi: désolé j'avais mal lu ton post (lu: "je mets" au lieu de "et mets", et comme ça venait juste après ma réponse... )
IceDev Posté 8 Août 2005 Auteur Posté 8 Août 2005 Bonsoir à tous ! J'ai retiré la quasi-totalité de ce que vous jugez (à raison j'en conviens), être du spamdexing de ma page d'accueil. La seule chose qui reste est un texte descriptif du site qui permet de palier au manque de contenu textuel de cette page d'accueil. Maintenant ma question c'est : est-ce qu'on peut sortir du spamdexing ? Où dois plutôt me consacrer à une nouvelle passe au niveau de l'indexation dans google avec un autre nom de domaine pour mon site ?
Dan Posté 9 Août 2005 Posté 9 Août 2005 Le site ne dispose à la base que de quelques pages accessibles au public non enregistré (5-6), mais j'ai optimisé ces pages en suivants les conseils de Wri (ajout de textes ciblés, de balises metas, importance des alt et title des images et liens, soumissions du site sur plus d'une centaine d'annuaires, etc). Je ne peux pas imaginer que le spamdexing soit une recommendation de WRI. Tu as donc suivi leurs conseils, en ajoutant "ta sauce". C'est cette "sur-optimisation" qui à mon avis empêché l'indexation du site dans Google. Je pense qu'il faut patienter. Surveille les passages de Googlebot sur la page d'accueil.
IceDev Posté 9 Août 2005 Auteur Posté 9 Août 2005 Oui je ne nie pas avoir rajouté notamment cette zone masquée sur-optimisée, que j'ai donc enlevé depuis, mais apparemment trop tard. Il y a des cas des presonnes qui avaient sur-optimisés leur site et on réussi, en retirant ces sur-optimisations, à finalement rentrer dans google ? Refaire mes soumissions via un autre domaine ne pourrait il pas me permettre d'accélérer les choses ?
Jeanluc Posté 9 Août 2005 Posté 9 Août 2005 N'y aurait-il pas également un problème de redirection 302 ?Sur la requête "databike" Google renvoie le site databike.net en 4ème position. Il connait donc le .net et pas le .com, or tu redriges l'un vers l'autre par une 302 (quand on sait les problèmes qu'a Google avec les 302..) Bonjour, Tout à fait d'accord avec Dudu. Google essaie de ne jamais indexer deux pages avec le même contenu, car les utilisateurs du moteur n'apprécient pas d'avoir deux fois le même résultat dans une recherche. Avec les redirections 302, le comportement de Google est assez imprévisible, mais que Google refuse d'indexer la page d'accueil en .com est logique car il l'a déjà indexée en .net. Une redirection 302 ne convient absolument pas ici. Pour éliminer ce problème, il faut remplacer la redirection 302 par une redirection 301 (toujours du .net vers le .com). De cette manière, les moteurs comprendront que c'est bien le .com qui est la bonne adresse, mais cela prendre du temps. Jean-Luc
IceDev Posté 9 Août 2005 Auteur Posté 9 Août 2005 Oui je me suis aussi posé cette question. Mes sur-optimisation ont certes pu déboucher sur du spamdexing, mais dans ce cas comment expliquer que le .net apparaisse sur Google ? Je vais jeter un oeil de ce pas au problème des redirections.
dièse Posté 9 Août 2005 Posté 9 Août 2005 (modifié) Tes problèmes d'indexation ne doivent pas avoir de rapport avec le spam. Mais par contre une fois indexé (en enlevant le PHPSESSID et la redirection 302, ça devrait se faire rapidement ), ces techniques ne te permettront pas d'avoir un bon positionnement sur Google. Entre parenthèses je ne me suis jamais vraiment intéressé à Yahoo , et je ne savais pas ce moteur aussi sensible au Spam Modifié 9 Août 2005 par dièse
IceDev Posté 19 Septembre 2005 Auteur Posté 19 Septembre 2005 ... j'ai acquis un nouveau nom de domaine (le .fr) et je vais donc bientôt m'atteler au re-référencement du site (les .net et .com étant blacklistés). Par contre j'hésite entre plusieurs solutions, l'essentiel étant de ne pas aussi blacklister ce 3e nom de domaine : - refaire tous les textes du site auxquels le moteur à accès et procéder à une modification des optims de référencement utilisées sur le site blacklisté (je pense notamment à modifier les balises métas) - faire une ou deux pages en plus sur le site actuel, qui serviront de pages d'entrées à l'actuel site en .com qui ne bougera pas d'un iota. A votre avis ?
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant