Jeanluc Posté 4 Octobre 2005 Posté 4 Octobre 2005 On conseille d'employer des tirets (-), plutôt que des soulignés (_) dans les adresses des pages. Il y a de très bonnes raisons pour ça, mais il ne faut pas en abuser. Je l'ai appris à mes dépends dans le référencement sur MSN Search. Certains sont sûrement déjà au courant. Pour les autres, j'ai résumé mes constatations dans un petit article : MSN Search - Tiret dans l'URL ? Jean-Luc
petit-ourson Posté 4 Octobre 2005 Posté 4 Octobre 2005 Et quand on a un ndd avec 3 tirets comme le mien ... c'est fini ;o)
Jan Posté 4 Octobre 2005 Posté 4 Octobre 2005 Très intéressant! Petit ourson, ton site souffirait-il de ce problème? http://search.msn.com/results.aspx?q=site%...n.com&FORM=QBRE
Jeanluc Posté 4 Octobre 2005 Auteur Posté 4 Octobre 2005 Je ne sais pas si le nombre de tirets dans le nom de domaine lui-même est important. Je ne sais pas non plus si c'est un phénomène nouveau ou si c'est comme ça depuis toujours. Par contre, je suis convaincu que dans les adresses des nouvelles pages ("noms de fichier"), les tirets tuent le référencement MSN. Jean-Luc
petit-ourson Posté 4 Octobre 2005 Posté 4 Octobre 2005 Mon site est comme cela depuis tous les temps sur MSN. Je ne pense pas avoir de trop grosses erreurs dessus et je n'au jamais triché d'aucune sorte. Seule la page d'accueil ressort. Le site est relativement vieux 2-3 ans pour le ndd.
dièse Posté 4 Octobre 2005 Posté 4 Octobre 2005 Félicitations pour cet article Je ne pense pas que ça soit un phénomène nouveau, j'avais déjà fait part de cette constation sur le Hub ( mon site rencontre ce problème et j'avais constaté que le site d'Arlette Lisons.info rencontrait le même problème ). Par contre je ne me doutais pas qu'il y avait une parade Pourrais-tu préciser un peu tes derniers tests ? dans "/carte/liege.html" est-ce que le premier / et le slash suivant directement le nom de domaine ? Ceci pour savoir si il faut absolument alterner les séparateurs si lon veut faire suivre son nom de domaine de 3 mots ou plus, ou si seul le tiret pose problème.
AvenueDuWeb Posté 4 Octobre 2005 Posté 4 Octobre 2005 Merci pour l'article, je n'avais pas fait trop gaffe, j'ai un forum phpbb rewrité avec le titre des messages dans l'URL, et tous les articles ou presque ne sont pas dans la base, où ils le sont mais avec le viewtopic.php?... (j'ai mis un robots.txt mais un peu trop tard, msn avait déjà référencé et visiblement il n'a pas l'air de vouloir revenir en arrière) Alors que Yahoo et Google ne posent aucun problème sur ce forum. Par contre les profils qui sont rewrités et qui n'ont qu'un seul tiret sont parfaitement indexés tout comme les catégories. Donc je confirme ce qui a été dit. Comment les moteurs de recherche perçoivent les virgules ? Je pourrais peut-être rewrité en 1_1-titre,du,message.php ? C'est quand même bizarre comme procédé de la part de MSN... @+
Eclipsis Posté 5 Octobre 2005 Posté 5 Octobre 2005 Merci pour cet article, je me suis souvent posé la question des multiples séparateurs, sans pour autant avoir fait des tests aussi poussés que les tiens... En revanche, ce que je ne comprends pas vraiment, c'est pourquoi dans ce cas, on obtient des résultats comme celui-ci sur MSN Search, puisque certains résultats ont plusieurs tirets dans leur URL (c'est le cas de Clubic ou Matbe)... Une idée??
Jeanluc Posté 5 Octobre 2005 Auteur Posté 5 Octobre 2005 Pourrais-tu préciser un peu tes derniers tests ? dans "/carte/liege.html" est-ce que le premier / et le slash suivant directement le nom de domaine ?Oui, l'adresse complète est maintenant [i]http://www.example.com/carte/liege.html. Comment les moteurs de recherche perçoivent les virgules ? Je pourrais peut-être rewrité en 1_1-titre,du,message.php ?Il y a probablement d'autres solutions que le slash, mais je n'ai pas fait d'essai avec la virgule. En revanche, ce que je ne comprends pas vraiment, c'est pourquoi dans ce cas, on obtient des résultats comme celui-ci sur MSN Search, puisque certains résultats ont plusieurs tirets dans leur URL (c'est le cas de Clubic ou Matbe)...C'est vrai. Certains sites semblent n'avoir aucun problème avec ces tirets successifs. Je n'ai aucune idée pourquoi MSN Search est allergique aux tirets successifs sur certains sites et pas sur d'autres. Jean-Luc
Le-juge Posté 5 Octobre 2005 Posté 5 Octobre 2005 Merci pour l'info et pour l'article Ils sont chez Msn...
Guest Crazy Posté 5 Octobre 2005 Posté 5 Octobre 2005 Le tiret (-) fonctionne aussi bien sur MSN que l'underscore (_) sur Google ! L'inverse qui était préconisé avant, semble obsolète dorénavant. Heureusement, car cela permet de se positionner correctement partout. Il ne faut pas oublier que l'usage de tel ou tel caractère est une forme de discrimination. Or, ce qui intérresse les Moteurs de Recherche, c'est d'avoir un maximum de sites, de préférence de bonne qualité (et là, peu importe que ce soit des - ou des _ qui séparent les mots-clés du titre (c'est mieux quand l'URL contient les principaux mots-clés). (Je pense avoir prouvé que l'on peut se positionner avec _ sur google et avec - sur MSN) et que l'usage de l'un ou de l'autre n'a plus beaucoup d'importance actuellement. Alain
Americas Posté 5 Octobre 2005 Posté 5 Octobre 2005 Effectivement, je viens de faire un recherche sur une série de pages que j'avais placé sur mon site... les unes comprenant un tiret, les autres un underscore. J'avais fait cela pour le même thème à chaque fois sur plusieurs mots clés... histoire de voir comment se comporte Google. Sur Google, les deux pages apparaissent bien souvent l'une en dessus de l'autre, dans un ordre qui n'est pas très déterminé. Donc on pouvait en conclure que Google se fiche pas mal si le séparateur est un tiret ou un underscore. Par contre, je viens de regarder sur MSN et aucune de mes pages avec l'underscore n'aparaissent dans les premiers résultats. C'est bon à savoir... et ça me réconforte dans mon idée d'utilser à chaque foir des tirets
jemords Posté 6 Octobre 2005 Posté 6 Octobre 2005 Pour ma part je ne préconise pas l'emploi des tirets. Par exemple il y a bon nombre d'utilisateurs qui surfe à travers un proxy. Souvent dans la configuration de ces proxy, les urls avec tirets sont mal interprétés voire même bloqués du coup vous manquez des visites.
Dan Posté 6 Octobre 2005 Posté 6 Octobre 2005 Le site www.lisons.info n'a aucune de ses URLs comprenant des tirets sur MSN. Cela tendrait à démontrer que MSN n'aime pas les tirets (faut-il dire 'trop de tirets' ?) dans l'URL.
dièse Posté 6 Octobre 2005 Posté 6 Octobre 2005 (modifié) 2 tirets ça passe à peu prêt (donc 3 mots après le tld), plus de 2 tirets aucune page d'indexée. Quand j'avais constaté ça, j'en avais tiré la conclusion très hasardeuse que c'était une tentative (plus que maladroite) de MSN de détecter les suroptimisations (pour imiter son grand frère Google ). Je dis cela parce qu'il me semble qu'à l'époque de la béta l'indexation des sites était tout à fait normale (qu'il y ait 1, 2 ou 10 tirets). Modifié 6 Octobre 2005 par dièse
Americas Posté 6 Octobre 2005 Posté 6 Octobre 2005 Le site www.lisons.info n'a aucune de ses URLs comprenant des tirets sur MSN.Cela tendrait à démontrer que MSN n'aime pas les tirets (faut-il dire 'trop de tirets' ?) dans l'URL. <{POST_SNAPBACK}> Avec un tiret ça passe sans problème dans MSN : http://search.msn.fr/results.aspx?q=voyage...ntine&FORM=QBHP Sur Google, tiret ou underscore, c'est pas un problème : http://www.google.fr/search?hl=fr&c2coff=1...argentine&meta=
Jeanluc Posté 6 Octobre 2005 Auteur Posté 6 Octobre 2005 Bonjour, Pour en revenir au sujet de l'acceptation par MSN de plusieurs tirets dans les URL ou pas, je me rends compte qu'il y a (au moins) un facteur qui m'échappe complètement. Je dois peut-être reprendre les choses à la base. Mes constatations concrètes étaient : 1. Sur le site www.en-belgique.com, je n'ai aucune URL avec 2 tirets successifs (ou plus) qui soit acceptée par MSN, alors que la plupart de mes URL avec 0 ou 1 tiret sont acceptées sans problème particulier. 2. Sur le même site, en remplaçant des URL avec 2 tirets successifs par des URL sans tiret, certaines de ces nouvelles URL ont été indexées en moins d'une semaine, alors que les anciennes existaient depuis des mois sans être indexées. 3. Sur www.annuaire-info.com, si j'examine les URL d'un échantillon de pages (pages proches de la racine et articles), j'obtiens ceci : /ajouter-annuaire.html : indexé /charte-qualite.html : indexé /contact.html : indexé /documentation-outil.html : indexé /feedback.html : indexé /liens-durs-liens-mous-redirections.html : NON INDEXE /referencement-manuel.html : indexé /tos.html : indexé /google-affichage-en-gras.html : NON INDEXE /google-inscrire-un-site.html : NON INDEXE /google-pages-france.html : NON INDEXE /google-pages-francophones.html : NON INDEXE /google-penalites.html : indexé /google-poids-des-mots.html : NON INDEXE /google-referencement-faq.html : NON INDEXE /google-separateur.html : indexé /msn/url-tiret.html : en ligne depuis hier et indexé /redirection-test.html : indexé /simulateur-google.html : indexé C'est assez parlant. Il n'y a qu'à compter les tirets. Mais visiblement, dans certains autres domaines (autres sites) les 2 tirets successifs sont acceptés. Les deux noms de domaines qui ont servi pour mes tests contiennent eux-mêmes un tiret. Pensez-vous que ce tiret dans le nom de domaine rende MSN plus hostile à la présence de tirets dans la suite de l'URL ? Je me pose cette question en lisant la réponse de dièse qui semble dire que, chez lui, les 2 tirets successifs passent. Jean-Luc P.S. Americas, j'ai l'impression que tes remarques sur les tirets et underscores ne concernent pas le sujet de ce fil.
dièse Posté 6 Octobre 2005 Posté 6 Octobre 2005 (modifié) site: sur msn La plupart de mes pages sont de la forme : domaine.com/motclé1-motclé2-idcategorie-idarticle.html et ne sont pas indexées, il m'est très facile de faire comme toi une étude au cas par cas et de voir que les pages de la formes "motclé1-motclé2-idarticle.html" sont indexées ainsi que les pages de la forme "motclé1-idcategorie-idarticle.html". J'ai un autre site basé sur le même rewriting sur lequel je peux constater la même chose. J'essaie de mettre en place demain du cloaking sur les urls , ça me sera facile j'utilise des fonctions pour écrire mes urls rewrités, on verra ce que cela donne la semaine prochaine ( ou du moins dans le mois qui vient, avec MSN mieux vaut être prudent ). C' Pour moi ça ne fait pas de doute que le tiret présent dans tes noms de domaine est comptabilisé, même si ça parait complètement idiot comme problème [edit]hi hi j'ai un autre site rewrité de la même façon avec un tiret dans le nom de domaine, et je viens de constater la même chose que pour tes sites, trop fort MSN [/edit] Modifié 6 Octobre 2005 par dièse
dièse Posté 6 Octobre 2005 Posté 6 Octobre 2005 Euuuhh tout ceci me fait penser que je n'ai jamais réussi à faire indexer mon site pour le concours sorcier-glouton : http://www.spirit-of-samsara.com/sorcier-glouton on était peut-être quelques-uns dans le même cas
Cendrillon Posté 6 Octobre 2005 Posté 6 Octobre 2005 Quand j'avais constaté ça, j'en avais tiré la conclusion très hasardeuse que c'était une tentative (plus que maladroite) de MSN de détecter les suroptimisations (pour imiter son grand frère Google ). Je dis cela parce qu'il me semble qu'à l'époque de la béta l'indexation des sites était tout à fait normale (qu'il y ait 1, 2 ou 10 tirets). <{POST_SNAPBACK}> j'ai l'impression qu'ils s'attaquent surtout aux sites "rewrités" avec reprise dans l'url de phrases entières (avec les blancs remplacés par des tirets) ... Mais visiblement, dans certains autres domaines (autres sites) les 2 tirets successifs sont acceptés. <{POST_SNAPBACK}> Bah peut être que MSN n'applique pas ses nouvelles règles de manière rétroactives (autrement dit les sites à multiples tirets bien indéxés étaient peut être déjà indexés quand MSN à mis en oeuvre cette nouvelle règle ...
Jeanluc Posté 6 Octobre 2005 Auteur Posté 6 Octobre 2005 Dièse, C'était pas de chance pour le concours... Merci pour tes réponses. Pour l'instant, je dirais que la règle est : Indexation quasi-impossible si : - si 1 tiret dans le nom de domaine et 2 tirets successifs (ou plus) dans un nom de "fichier" ou de "répertoire". - si au moins 3 tirets successifs dans un nom de "fichier" ou de "répertoire". Mais, l'énigme n'est pas encore complètement résolue, car il existe des contre-exemples : - 6 tirets successifs - 2 tirets dans le sous-domaine, un tiret dans le répertoire et 2 tirets dans le nom de fichier Donc là manifestement, on voit que certains passent entre les mailles du filet. Jean-Luc
AvenueDuWeb Posté 6 Octobre 2005 Posté 6 Octobre 2005 Merci pour tes réponses. Pour l'instant, je dirais que la règle est : Indexation quasi-impossible si : - si 1 tiret dans le nom de domaine et 2 tirets successifs (ou plus) dans un nom de "fichier" ou de "répertoire". - si au moins 3 tirets successifs dans un nom de "fichier" ou de "répertoire". En fait je ne sais plus trop quoi penser car par exemple sur mon forum rewrité, la plupart des pages ne sont pas indexées avec le rewriting (msnsearch ne veut pas de mon robot.txt) et généralement toutes celles avec plusieurs tirets mais par exemple celle-là aucun problème : http://search.msn.fr/results.aspx?q=site%3...tible&FORM=QBRE Mais c'est le seul membre indexé avec plusieurs tirets, tous les autres qui en ont plus de 1 ne sont pas indexés... C'est quand même dingue qu'à l'intérieur du même site, msn réagit différemment, j'irai presque jusqu'à dire "aléatoirement". C'est très étrange. @+
Guest Crazy Posté 7 Octobre 2005 Posté 7 Octobre 2005 (modifié) Par contre, je viens de regarder sur MSN et aucune de mes pages avec l'underscore n'aparaissent dans les premiers résultats. <{POST_SNAPBACK}> Ca, c'est bizarre car chez moi, toutes les pages avec underscore se placent assez bien sur MSN ! Il est vrai que je n'utilise que très rarement plusieurs underscores ou tirets dans mes URLs (ce ne peut être, éventuellement, que pour des pages secondaires, images ou textes, qui n'ont pas forcément à être indexées). Euuuhh tout ceci me fait penser que je n'ai jamais réussi à faire indexer mon site pour le concours sorcier-glouton :http://www.spirit-of-samsara.com/sorcier-glouton on était peut-être quelques-uns dans le même cas <{POST_SNAPBACK}> Justement, en parlant de ça, et malgré un parcours erratique et mal terminé (probablement à cause de trop de tripatouillage [mea culpa] dans mes pages), http://www.******.fr/sorcier_glouton/ M'a permis de vérifier que l'underscore est assez bien perçcu par MSN Search. A été indexé en deux trois jours et a été entre 10 et 2 pendant plusieurs jours, pour ne pas dire plusieurs semaines... Cela n'aide pas beaucoup pour en tirer des conclusions fiables quant à l'utilisation du tiret ou de l'underscore sur MSN ! <EDIT Crazy> Mais, il me vient une idée soudaine MSN (surtout msn.fr) ne comprendrait-il pas (depuis peu) le tiret comme étant un signe ostentatoire d'identification d'un mot composé ? - Si oui, il est quasi-logique que certaines URLs en comportant plusieurs ne soient pas indexées (défaut de sémantique ou de syntaxe supposé détecté). - Si non, il n'y a pas de raison pour que MSN n'indexe pas correctement les URLs en comprenant plusieurs (le tiret n'a alors qu'une vocation de séparateur, au même titre que l'underscore). C'est peut être dans cette direction qu'il faut chercher ? </EDIT> Alain Modifié 7 Octobre 2005 par Crazy
Jeanluc Posté 7 Octobre 2005 Auteur Posté 7 Octobre 2005 Ce n'est vraiment pas facile de décrypter le pourquoi du comment de cet MSNbot. j'ai l'impression qu'ils s'attaquent surtout aux sites "rewrités" avec reprise dans l'url de phrases entières (avec les blancs remplacés par des tirets) ... Je ne pense pas que le problème ait un rapport avec le rewriting. Sur annuaire-info.com, les pages que j'ai citées ne sont pas rewritées, ce sont de bonnes pages HTML statiques à l'ancienne et les tirets y provoquent des problèmes d'indexation. Bah peut être que MSN n'applique pas ses nouvelles règles de manière rétroactives (autrement dit les sites à multiples tirets bien indéxés étaient peut être déjà indexés quand MSN à mis en oeuvre cette nouvelle règle ... Possible, mais comment tester ça ? Un peu dans le même ordre d'idées, il se pourrait que les URL avec tirets soient mises dans une file d'attente pendant X mois (une sandbox/tiret-box Microsoft) avant d'être visitées par MSNbot. http://search.msn.fr/results.aspx?q=site%3...tible&FORM=QBRE Mais c'est le seul membre indexé avec plusieurs tirets, tous les autres qui en ont plus de 1 ne sont pas indexés... C'est quand même dingue qu'à l'intérieur du même site, msn réagit différemment, j'irai presque jusqu'à dire "aléatoirement". C'est très étrange. @+ Il doit bien y avoir une raison : les backlinks peut-être ? Jean-Luc
AvenueDuWeb Posté 7 Octobre 2005 Posté 7 Octobre 2005 Il doit bien y avoir une raison : les backlinks peut-être ? Non un seul lien pour tous les profils, la page memberlist... C'est autre chose... mais quoi ?
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant