BZHcool Posté 1 Janvier 2004 Posté 1 Janvier 2004 Bon je continue l'étude de mon site... J'ai rajouté recemment une nouvelle Url sur la page d'acueil...GG l'a trouvé et hop indexé... du moins comme pour 99.97% de mes pages "sans titre, ni description" Là j'en perds mon Latin... Bon GG il va falloir prendre une grande résolution en ce début d'année 2004...mettre un titre et une desciption à toutes mes pages Est ce que quelqu'un d'autre à le même soucis que moi... et si oui depuis combien de temps?
Fupap Posté 1 Janvier 2004 Posté 1 Janvier 2004 bonjour j ai eu ce genre de probleme, a la place du titre j avais l' url pas de description ( les miennes ), uniquement celle de dmoz et ce sur 100% des pages ca venait de mon robot txt alors je ne sais pas si tu l' utilise, mais regardes peut etre par la
BZHcool Posté 2 Janvier 2004 Posté 2 Janvier 2004 Je n'utilise pas de robots.txt... Penses tu qu'il faudrait que j'en mette un...même vide
Cliquedur Posté 2 Janvier 2004 Posté 2 Janvier 2004 Salut BZHcool, et meilleurs voeux de visibilité pour 2004 et + ! Pour le robots.txt, oui, mets-le, quitte à tout autoriser. Enfin, je suppose que tu as quand même des dossiers à bloquer (admin ... etc)
BZHcool Posté 2 Janvier 2004 Posté 2 Janvier 2004 Merci Cliquedur, Et meilleurs voeux à toi aussi et pour ta boite du côté de Vannes... J'ai préparé un petit robots.txt... je finis deux ou trois choses et je le mets en place aujourd'hui...
Dams Posté 2 Janvier 2004 Posté 2 Janvier 2004 Une fois que tu l'aura mis en ligne.... * Teste le avec mon utilitaire de vérification de robots.txt gratuit ... Ca t'évitera des mauvaises surprises
BZHcool Posté 2 Janvier 2004 Posté 2 Janvier 2004 Je l'ai découvert ce matin... C'est lui qui m'a aidé à faire mon Robots... Par contre il y a un espace entre les : et *
BZHcool Posté 2 Janvier 2004 Posté 2 Janvier 2004 Si j'ai bien compris il n'y a pas d'espace entre User-agent: et *... Et lorsque je fait "editer ce fichier robots.txt" sur ta page, j'ai un résultat avec : User-agent: * et là il y a un espace...
Dams Posté 2 Janvier 2004 Posté 2 Janvier 2004 Il faut bien un espace entre le User-agent: et le nom du crawler ou le *.
BZHcool Posté 2 Janvier 2004 Posté 2 Janvier 2004 Merci Dams... j'avais compris de travers... Qu'est ce que çà va etre en fin d'année
Dams Posté 2 Janvier 2004 Posté 2 Janvier 2004 J'ai pas envie que tu te retrouves exclu de google a cause d'un robots.txt incorrect
BZHcool Posté 5 Janvier 2004 Posté 5 Janvier 2004 Bon! je continue mon périple avec GG.... Là! je ne comprends plus rien... la semaine dernière j'avais encore 115 Urls(même sans titre , ni descriptions) sur l'index GG et ce soir...Boum... plus que 15 Urls et la majorité sont des liens d'avant Urls Rewriting!!! C'est à dire avec des variables... C'est quoi ce binz avec mon annuaire... Celà pourrait il venir d'un problème dans mes lignes de script... ce qui empécherait GG de visiter et d'indexer corrctement mes pages... ce qui me parait peut probable car j'ai des visites de d'autres Robots sur ces pages. Plus j'ai de liens dans mes pages et plus j'améliore mon site... du moins ma page d'accueil et plus je recule sur l'index GG... Je vais finir par mettre la clé sous la porte pour cet Annuaire et me lancer dans autre chose... la couture par exemple Si quelqu'un à déjà vu çà je suis preneur... surtout s'il a une solution à me donner! Je vais finir par croire que GG (Américain je crois! ) à une dents contre les régions Françaises...
lapîn Posté 6 Janvier 2004 Posté 6 Janvier 2004 Je vais finir par croire que GG (Américain je crois! ) à une dents contre les régions Françaises... ouai je crois que c'est la seule explication plausible!
BZHcool Posté 8 Janvier 2004 Posté 8 Janvier 2004 Bonjour, Je viens de m'apercevoir que GGbot vient de passer sur mon site... grand mot que "passer"... il c'est arrêté à la page d'accueil!!!! Et là! paf je vois que Mr Bot crawl ma page suivante : -http://france-region.com/ sans le "www." Ceci pourrait il être l'explication du fait qu'il ne va pas sur mon annuaire qui lui génère des pages avec le www. Si oui... comment faire pour donner l'ordre à GG de ne pas passer sur l'url sans les WWW mais sur celle avec...
Dan Posté 8 Janvier 2004 Posté 8 Janvier 2004 Salut Seb ! Un petit coup de réécriture d'URL et c'est réglé :!: RewriteCond %{HTTP_HOST} !^www\.france-region\.com [NC]RewriteRule (.*) http://www.france-region.com/$1 [L,R=301] Si le nom du Host n'est pas www.france-region.com (par exemple si le www manque) on redirige le tout sur le bon domaine (avec le www) avec une entête 301. Dan
BZHcool Posté 8 Janvier 2004 Posté 8 Janvier 2004 Salut Dan, Donc ces deux lignes dans mon .htaccess à la racine du site et hop l'affaire est jouée.. Pourtant mon Nom de Domaine est bien enregistré sous www.france-region.com ... de plus, les autres robots crawle correctement mon site par cette Urls avec www.!!! Pourquoi GGbot lui ne voit que l'url sans les www. Mais si je rajoute ces deux lignes... celà n'aura pas d'incidence pour les autres robots qui passent bien pour le moment...
Dan Posté 8 Janvier 2004 Posté 8 Janvier 2004 Salut Seb, C'est que tu dois avoir quelque part un site qui pointe sur le tien sans le www. Ca peut être n'importe quoi, comme un message dans un forum avec un lien. Pas de problème, mets ces deux lignes dans le .htaccess de la racine et c'est tout bon. Il faut tout de même une ligne au dessus de celles-là: RewriteEngine on Aucun impact sur les visiteurs et/ou moteurs qui accèdent par le www, comme la réécriture ne se fait pas dans ce cas. Dan
BZHcool Posté 8 Janvier 2004 Posté 8 Janvier 2004 Merci dan, La redirection marche très bien... reste à voir si c'est celà qui bloquait le GGbot...
Dan Posté 8 Janvier 2004 Posté 8 Janvier 2004 La redirection marche très bien... Tu avais des doutes En fait, rien n'etait bloquant. Mais il vaut mieux ne laisser indexer que le www et rediriger le reste. Tu n'as pas de lien sans le www sur ta page d'accueil, donc ce n'est pas de chez toi que ça vient. A moins d'un lien au départ d'une page interne au site ? As-tu fait une recherche globale pour essayer de trouver si ce n'est pas toi qui a fait l'erreur sur une de tes pages? Dan
BZHcool Posté 12 Janvier 2004 Posté 12 Janvier 2004 Bon çà continue.... Et un point de moins pour mon PR.... Question? le fait d'avoir un script en javascript entre mes balises <head> et </head> sur ma page d'accueil... peut il avoir une incidence sur le suivi de mes liens par GG? D'autant plus que ce java sert à jouer avec une image pour l'ouverture de mon dossier links contenant mon annuaire...
Neoboot Posté 12 Janvier 2004 Posté 12 Janvier 2004 Salut, Cela depend si ton javascript est sous la forme <a href="#" blablabla>lien</a> ou alors si il est sous la forme <a href="tapage.htm" onclick="tonjavascript" target="lacible">lien</a>. Si c'est le second cas tu ne crains rien, google pourras le suivre, sinon ta page il ne la verrras pas
Dan Posté 12 Janvier 2004 Posté 12 Janvier 2004 Salut Seb, Cela ne devrait pas jouer sur l'indexation Google (j'ai été regarder la source de ta page) Par contre, tu pourrais régler ce détail sans même utiliser de Javascript, en utilisant une image plus grande, contenant tes deux images actuelles l'une en dessous de l'autre. L'image qui s'afficherait lors d'un rollover peut se définir avec 2 styles css, un "normal" et l'autre "hover", en redéfinissant simplement le background-position pour faire apparaître la bonne partie de l'image en arrière plan de cette zone Plus d'infos sur cette technique astucieuse sur le site Pompage.net Dan
BZHcool Posté 12 Janvier 2004 Posté 12 Janvier 2004 Alors entre <head> et </head> j'ai : <script language="JavaScript" type="text/javascript">if (document.images) {entrer_b3_off = new Image(); entrer_b3_off.src = "bouton/entrer_b3.gif"entrer_b3_over = new Image(); entrer_b3_over.src = "bouton/entrer_b3_over.gif"}function turn_off(ImageName) { if (document.images != null) { document[ImageName].src = eval(ImageName + "_off.src"); }}function turn_over(ImageName) { if (document.images != null) { document[ImageName].src = eval(ImageName + "_over.src"); }}</script> et dans le corps de ma page j'ai : <a href="http://www.france-region.com/links/index.php3" onMouseOut="turn_off('entrer_b3')" onMouseOver="turn_over('entrer_b3')" ><img name="entrer_b3" src="bouton/entrer_b3.gif" alt="" width="226" height="42" border="0"></a> mais j'ai également un autre lien vers la page de mon annuaire (sans java)... Vraiment je me demande si j'ai pas quelques chose qui empêche de suivre mes liens... Je commence a me demander si j'ai pas fait une erreur dans les script de mon annuaire lorsque j'ai modifié les Urls pour apsser en Rewriting...
BZHcool Posté 13 Janvier 2004 Posté 13 Janvier 2004 Bonjour, A croire qu'il n'y a que GGbot qui boude mon site... Hier soir : Fast (48 pages...toutes en Urls rewriting) et turnitin (9 pages en Rewriting) Donc les liens peuvent etre suivis... pourquoi ce GG ne veut il pas les suivre???
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant