Aller au contenu

Sujets conseillés

Posté

Bon je continue l'étude de mon site...

J'ai rajouté recemment une nouvelle Url sur la page d'acueil...GG l'a trouvé et hop indexé... du moins comme pour 99.97% de mes pages "sans titre, ni description"

Là j'en perds mon Latin... :wacko:

Bon GG il va falloir prendre une grande résolution en ce début d'année 2004...mettre un titre et une desciption à toutes mes pages :D

Est ce que quelqu'un d'autre à le même soucis que moi... et si oui depuis combien de temps?

  • Réponses 66
  • Créé
  • Dernière réponse

Contributeurs actifs dans ce sujet

Contributeurs actifs dans ce sujet

Posté

bonjour

j ai eu ce genre de probleme,

a la place du titre j avais l' url

pas de description ( les miennes ), uniquement celle de dmoz

et ce sur 100% des pages

ca venait de mon robot txt

alors je ne sais pas si tu l' utilise, mais regardes peut etre par la

Posté

Salut BZHcool, et meilleurs voeux de visibilité pour 2004 et + :P !

Pour le robots.txt, oui, mets-le, quitte à tout autoriser. Enfin, je suppose que tu as quand même des dossiers à bloquer (admin ... etc) :rolleyes:

Posté

Merci Cliquedur,

Et meilleurs voeux à toi aussi et pour ta boite du côté de Vannes...

J'ai préparé un petit robots.txt... je finis deux ou trois choses et je le mets en place aujourd'hui...

Posté

Je l'ai découvert ce matin...

C'est lui qui m'a aidé à faire mon Robots...

Par contre il y a un espace entre les : et *

Posté

Si j'ai bien compris il n'y a pas d'espace entre User-agent: et *...

Et lorsque je fait "editer ce fichier robots.txt" sur ta page, j'ai un résultat avec :

User-agent: *

et là il y a un espace...

Posté

Il faut bien un espace entre le User-agent: et le nom du crawler ou le *.

Posté

J'ai pas envie que tu te retrouves exclu de google a cause d'un robots.txt incorrect :D

Posté

Bon! je continue mon périple avec GG....

Là! je ne comprends plus rien... la semaine dernière j'avais encore 115 Urls(même sans titre , ni descriptions) sur l'index GG et ce soir...Boum... plus que 15 Urls et la majorité sont des liens d'avant Urls Rewriting!!! C'est à dire avec des variables...

C'est quoi ce binz avec mon annuaire...

Celà pourrait il venir d'un problème dans mes lignes de script... ce qui empécherait GG de visiter et d'indexer corrctement mes pages... ce qui me parait peut probable car j'ai des visites de d'autres Robots sur ces pages.

Plus j'ai de liens dans mes pages et plus j'améliore mon site... du moins ma page d'accueil et plus je recule sur l'index GG... Je vais finir par mettre la clé sous la porte pour cet Annuaire et me lancer dans autre chose... la couture par exemple :D

Si quelqu'un à déjà vu çà je suis preneur... surtout s'il a une solution à me donner!

Je vais finir par croire que GG (Américain je crois! ) à une dents contre les régions Françaises...

Posté
Je vais finir par croire que GG (Américain je crois! ) à une dents contre les régions Françaises...

:D:D

ouai je crois que c'est la seule explication plausible!

Posté

Bonjour,

Je viens de m'apercevoir que GGbot vient de passer sur mon site... grand mot que "passer"... il c'est arrêté à la page d'accueil!!!!

Et là! paf je vois que Mr Bot crawl ma page suivante : -http://france-region.com/ sans le "www."

Ceci pourrait il être l'explication du fait qu'il ne va pas sur mon annuaire qui lui génère des pages avec le www. :?:

Si oui... comment faire pour donner l'ordre à GG de ne pas passer sur l'url sans les WWW mais sur celle avec...

Posté

Salut Seb !

Un petit coup de réécriture d'URL et c'est réglé :!:

RewriteCond %{HTTP_HOST}   !^www\.france-region\.com [NC]
RewriteRule  (.*)    http://www.france-region.com/$1 [L,R=301]

Si le nom du Host n'est pas www.france-region.com (par exemple si le www manque) on redirige le tout sur le bon domaine (avec le www) avec une entête 301. ;)

Dan

Posté

Salut Dan,

Donc ces deux lignes dans mon .htaccess à la racine du site et hop l'affaire est jouée.. ;)

Pourtant mon Nom de Domaine est bien enregistré sous www.france-region.com ... de plus, les autres robots crawle correctement mon site par cette Urls avec www.!!!

Pourquoi GGbot lui ne voit que l'url sans les www.

Mais si je rajoute ces deux lignes... celà n'aura pas d'incidence pour les autres robots qui passent bien pour le moment...

Posté

Salut Seb,

C'est que tu dois avoir quelque part un site qui pointe sur le tien sans le www.

Ca peut être n'importe quoi, comme un message dans un forum avec un lien.

Pas de problème, mets ces deux lignes dans le .htaccess de la racine et c'est tout bon.

Il faut tout de même une ligne au dessus de celles-là:

RewriteEngine on

Aucun impact sur les visiteurs et/ou moteurs qui accèdent par le www, comme la réécriture ne se fait pas dans ce cas. ;)

Dan

Posté

Merci dan,

La redirection marche très bien... reste à voir si c'est celà qui bloquait le GGbot...

Posté
La redirection marche très bien...

Tu avais des doutes :?::lol:

En fait, rien n'etait bloquant. Mais il vaut mieux ne laisser indexer que le www et rediriger le reste.

Tu n'as pas de lien sans le www sur ta page d'accueil, donc ce n'est pas de chez toi que ça vient.

A moins d'un lien au départ d'une page interne au site ?

As-tu fait une recherche globale pour essayer de trouver si ce n'est pas toi qui a fait l'erreur sur une de tes pages?

Dan

Posté

Bon çà continue....

Et un point de moins pour mon PR....

Question?

le fait d'avoir un script en javascript entre mes balises <head> et </head> sur ma page d'accueil... peut il avoir une incidence sur le suivi de mes liens par GG?

D'autant plus que ce java sert à jouer avec une image pour l'ouverture de mon dossier links contenant mon annuaire...

Posté

Salut,

Cela depend si ton javascript est sous la forme <a href="#" blablabla>lien</a> ou alors si il est sous la forme <a href="tapage.htm" onclick="tonjavascript" target="lacible">lien</a>.

Si c'est le second cas tu ne crains rien, google pourras le suivre, sinon ta page il ne la verrras pas :)

Posté

Salut Seb,

Cela ne devrait pas jouer sur l'indexation Google (j'ai été regarder la source de ta page)

Par contre, tu pourrais régler ce détail sans même utiliser de Javascript, en utilisant une image plus grande, contenant tes deux images actuelles l'une en dessous de l'autre.

L'image qui s'afficherait lors d'un rollover peut se définir avec 2 styles css, un "normal" et l'autre "hover", en redéfinissant simplement le background-position pour faire apparaître la bonne partie de l'image en arrière plan de cette zone ;)

Plus d'infos sur cette technique astucieuse sur le site Pompage.net

Dan

Posté

Alors entre <head> et </head> j'ai :

<script language="JavaScript" type="text/javascript">

if (document.images) {
entrer_b3_off = new Image(); entrer_b3_off.src = "bouton/entrer_b3.gif"
entrer_b3_over = new Image(); entrer_b3_over.src = "bouton/entrer_b3_over.gif"
}

function turn_off(ImageName) {
if (document.images != null) {
 document[ImageName].src = eval(ImageName + "_off.src");
}
}

function turn_over(ImageName) {
if (document.images != null) {
 document[ImageName].src = eval(ImageName + "_over.src");
}
}

</script>

et dans le corps de ma page j'ai :

<a href="http://www.france-region.com/links/index.php3" onMouseOut="turn_off('entrer_b3')" onMouseOver="turn_over('entrer_b3')" ><img name="entrer_b3" src="bouton/entrer_b3.gif" alt="" width="226" height="42" border="0"></a>

mais j'ai également un autre lien vers la page de mon annuaire (sans java)...

Vraiment je me demande si j'ai pas quelques chose qui empêche de suivre mes liens... :angry:

Je commence a me demander si j'ai pas fait une erreur dans les script de mon annuaire lorsque j'ai modifié les Urls pour apsser en Rewriting... :wacko:

Posté

Bonjour,

A croire qu'il n'y a que GGbot qui boude mon site...

Hier soir : Fast (48 pages...toutes en Urls rewriting) et turnitin (9 pages en Rewriting)

Donc les liens peuvent etre suivis... pourquoi ce GG ne veut il pas les suivre??? :blink:

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant

×
×
  • Créer...