lafleur Posté 10 Janvier 2006 Posté 10 Janvier 2006 (modifié) Salut Sébastien "Considérons une page web comme un livre. Si je recherche un livre sur un sujet (mot-clé) donné, je m'attends à ce que ce mot-clé figure en couverture." <{POST_SNAPBACK}> Sur ce coup, je trouve pas ta métaphore très adaptée. Elle suppose en effet qu'un titre de livre est forcément explicatif. C'est loin d'être le cas en général, ce n'est même pas systématique pour des ouvrages didactiques. Exemple facile : je cherche un ouvrage sur Dieu ; avec cette méthode, je risque de louper la Bible et l'Ancien Testament. Modifié 10 Janvier 2006 par lafleur
Sebastien Posté 10 Janvier 2006 Posté 10 Janvier 2006 Je crains que tout cela ne relève que du voeux pieu Alors pourquoi tant de H1 dans les pages satellites ? Le respect des principales normes a bien sur un effet positif sur le référencement car les balises dites sémantiques donnent du sens et structurent le contenu. Et le respect des normes assure de lever les princpaux obstacles à l'indexation (comme la nondépendance à un langage de script pour les liens). Après il n'y a pas de prime à la conformité : si une page ne valide pas XHTML simplement parce qu'un <li> n'a pas été fermé, ca n'aura bien sur aucune influence sur le référencement. je cherche un ouvrage sur Dieu ; avec cette méthode, je risque de louper la Bible et l'Ancien Testament C'est imparfait effectivement, mais les moteurs ont leurs limites (recherche dieu dans Google). Se pose aussi un probleme : si on tape dieu dans Google qu'est ce qui devrait ressortir ? La bible, la torah, le coran ?
Cendrillon Posté 10 Janvier 2006 Posté 10 Janvier 2006 (modifié) Alors pourquoi tant de H1 dans les pages satellites ? <{POST_SNAPBACK}> pense tu vraiment que ceux qui truffent leus pages satellites de balise H1 recherchent une quelconque conformité ? ils se sont rendu compte que les balises H1 avec un certain dosage amélioraient le positionnement des pages et l'appliquent (un peu comme les indiens d'Amazonie qui découvrent que certaines plantes ont un effet bénéfique sur telle ou telle maladie et la consomment) ... Modifié 10 Janvier 2006 par cendrillon
Le-juge Posté 10 Janvier 2006 Posté 10 Janvier 2006 Sur ce coup, je trouve pas ta métaphore très adaptée. Elle suppose en effet qu'un titre de livre est forcément explicatif. C'est loin d'être le cas en général, ce n'est même pas systématique pour des ouvrages didactiques. Dans la pratique c'est une analogie qu'il faut faire il y a donc quelques arrangements a faire pour que ca colle. Perso je compare plutot le titre du bouquin au nom de domaine du site. je cherche un ouvrage sur Dieu ; avec cette méthode, je risque de louper la Bible et l'Ancien Testament Ben oui - il faut aussi penser que les moteurs de recherche sont des robots - betes et mechants - il ne faut pas leur en demander trop non plus. A cote de ca sur la totalite des requetes qui concernent dieu je suis sur qu'il doit bien en avoir quelques unes qui contiennet "bible" ou "ancien testament" Ensuite ce n'est pas parce que le titre de ton livre n'est pas "dieu" que le contenu du livre n'est pas truffe de ce mot cle (et la a priori dans la bible il y est un ou 2 fois quand meme) donc du coup je pense que sur la requete "dieu" il y a des chances pour que la bible (toujours dans notre analogie) ressorte plutot bien. Enfin si on regarde les resultats sur la requete qui nous interesse ("dieu" donc) et bien le site qui ressort en premier est un site dont le ND (titre de bouquin dans mon analogie) est effectivement dieu. resultats ici Voila en esperant avoir ete clair meme si je n'ai pas ete conscis
Denis Posté 11 Janvier 2006 Posté 11 Janvier 2006 Ensuite ce n'est pas parce que le titre de ton livre n'est pas "dieu" que le contenu du livre n'est pas truffe de ce mot cle (et la a priori dans la bible il y est un ou 2 fois quand meme) donc du coup je pense que sur la requete "dieu" il y a des chances pour que la bible (toujours dans notre analogie) ressorte plutot bien. C'est pourquoi sémantiquement le HTML nous offre une série d'outils à ajouter dans notre arsenal : h2, h3, h4, h5, h6, p, blockquote, ul, ol, etc. À chaque outil son utilité et les pages Web seront (encore) mieux référencées!
appollo Posté 11 Janvier 2006 Posté 11 Janvier 2006 (modifié) On en revient tous simplement à la question de la sémantique. A savoir qu'a terme je pense que la technique des pages sat avec des H1 comportant le meme mot clef ne marchera plus et qu il faudra utiliser des synonymes ou des expressions évoquant un meme mot ........... Pour en revenir à la question de départ je dirais qu'une balise h1 oui deux balise H1 oui mais il te faut beaucoup du conetenu 3 balises H1 en core plus de contenu 4 balise H1................. voila Modifié 11 Janvier 2006 par appollo
Le-juge Posté 11 Janvier 2006 Posté 11 Janvier 2006 On en revient tous simplement à la question de la sémantique. A savoir qu'a terme je pense que la technique des pages sat avec des H1 comportant le meme mot clef ne marchera plus et qu il faudra utiliser des synonymes ou des expressions évoquant un meme mot ........... Parfaitement. Je pense et j'espere que les moteurs de recherche sont d'ailleurs en train de se pencher sur des technologies plus intelligentes et capables de "comprendre" la substantifique moelle d'un contenu. Mais bon a priori c'est pas demain la veille.
appollo Posté 11 Janvier 2006 Posté 11 Janvier 2006 Je ne retrouve plus l'article mais j'avais vu un topic sur un forum us qui parlait de sémantique et qui laissé entendre que dans la langue de shakspear google est entrain de faire des test mais bon ce ne sont que des test et rien n'etait prouvé si je le retrouve je vous en fait part promis
Denis Posté 12 Janvier 2006 Posté 12 Janvier 2006 On en revient tous simplement à la question de la sémantique. Toujours. Et c'est le plus loin que nous pouvons aller dans nos hypothèses sur la question sans pour autant tomber dans les suppositions.
Cendrillon Posté 12 Janvier 2006 Posté 12 Janvier 2006 (modifié) finalement je ne suis pas sûre qu'il soit si intéressant que cela que Google donne trop d'importance (le fait il ?) aux balises Hx dans ses algorithmes de classement de pages ... le problème c'est que s'il le fait, cela risque de rapidement dénaturer l'utilisation de ces balises (de même que la prise en compte des liens dans l'évaluation de la popularité en a dénaturé l'utilisation), et cela deviendrait de toute façon très vite une information quasi inexploitable ... en tout cas je vois 2 risques majeurs à cela : - d'une part le détournement massif de ces balises à des fins de positionnement de page les rendraient rapidement inutilisables dans leurs fonctions premières (notament pour les aspects accessibilité) ... - d'autre part, donner du poids à ces balises obligerait Google à déployer des filtres complexes pour détecter les # cas d'utilisations détournées, avec les risque d'effets collatéraux et les consommations de ressources (temps et puissance CPU) que cela implique ... jeu en vaut il vraiment la chandelle ? je pense qu'il serait préférable que Google attende d'avoir suffisament avancé sur une véritable analyse sémantique du contenu visible, et de laisser ces balises aux navigateurs et autres "lecteurs" ... Modifié 12 Janvier 2006 par cendrillon
Régis Posté 12 Janvier 2006 Posté 12 Janvier 2006 finalement je ne suis pas sûre qu'il soit si intéressant que cela que Google donne trop d'importance (le fait il ?) aux balises Hx dans ses algorithmes de classement de pages ... (..)Bonjour, Il me semblait que c'était déjà le cas... il me semble avoir lu cela, il y a plusieurs mois mais je n'arrive pas à mettre la main sur l'article...
Denis Posté 12 Janvier 2006 Posté 12 Janvier 2006 le problème c'est que s'il le fait, cela risque de rapidement dénaturer l'utilisation de ces balises Je suis entièrement en désaccord et, avec tout le respect que je te dois, je ne crois pas que tes arguments (ou craintes) soient fondés - après tout, la raison d'être de cet élément, c'est de baliser le ou les titres d'une page... et en tant que tels, ils devraient être pris en compte puisque par définition, un titre peut potentiellement bien représenter le contenu qui le suit. Évidemment, si quelques abuseurs commençaient à créer des pages contenant 300 balises h1, ce serait autre chose... mais l'abus de ce type est facilement identifiable, il n'y a qu'à les dénombrer et mesurer le nombre de mots contenus dans chacun d'eux pour savoir si on fait face ou non à un usage abusif.
Cendrillon Posté 12 Janvier 2006 Posté 12 Janvier 2006 (modifié) après tout, la raison d'être de cet élément, c'est de baliser le ou les titres d'une page... et en tant que tels, ils devraient être pris en compte puisque par définition, un titre peut potentiellement bien représenter le contenu qui le suit. <{POST_SNAPBACK}> certes tu as raison, mais dans un Web parfait où le rôle des moteurs ne serait pas intrusif (ce qui n'est malheureusement pas vraiment le cas actuellement) ... mais ne pense tu pas, s'il s'avérait (voire même si juste une rumeur dans ce sens se répendait) que ces balises ont un poids important (ce que je ne pense pas) dans le positionnement des pages, qu'elles seraient alors rapidement et massivement détournées de leurs fonctions et du coup perdraient tous sens sémantique (un peu comme ce fut le cas de la méta keyword)? [edit] à la relecture de ton post je me demande si l'on s'est bien compris : quand je dis que l'utilisation par Google de ses balises risque d'en dénaturer l'utilisation ... je veux bien sûr parler d'effet indirect et que c'est la réaction de certains webmasters peu scrupuleux qui risque de dénaturer l'utilisation de ces balises bien sûr ... Modifié 12 Janvier 2006 par cendrillon
Sebastien Posté 12 Janvier 2006 Posté 12 Janvier 2006 D'ailleurs les moteurs ne devraient pas tenir compte du contenu des sites, c'est trop facilement manipulable, les webmasters pourraient se mettre à écrire
Denis Posté 12 Janvier 2006 Posté 12 Janvier 2006 mais ne pense tu pas, s'il s'avérait (voire même si juste une rumeur dans ce sens se répendait) que ces balises ont un poids important (ce que je ne pense pas) dans le positionnement des pages, qu'elles seraient alors rapidement et massivement détournées de leurs fonctions et du coup perdraient tous sens sémantique (un peu comme ce fut le cas de la méta keyword)? La première question que j 'ai envie de te poser c'est pourquoi douterais-tu de l'importance du poids de cet élément? Crois-tu réellement que pour trois manières d'écrire un titre soit : <h1>Titre de la page</h1> <p style="font-size: 125%; font-family: verdana; font-weight: bold;">Titre de la page</p> <font face="verdana" size="5"><b>Titre de la page</b></font> Que pour Google ce soit du pareil au même? Que le moteur est assez intelligent pour comprendre que c'est un titre, donc un identifiant de contenu? Personnellement, j'en doute fort. Il y a une différence fondamentale entre les éléments hx et les balises meta. Les balises metas n'ont aucune valeur sémantique, mais plutôt une valeur de meta-information ce qui est complètement autre chose. De plus, contrairement aux éléments HTML contenus dans le <body>, il n'y a aucune association directe entre le contenu d'une balise meta et le véritable contenu d'une page Web. C'est pourquoi ces balises ont rapidement perdu leur raison d'être et leur pertinence et que l'on peut encore discuter de la pertinence des éléments avec une réelle valeur sémantique. D'ailleurs les moteurs ne devraient pas tenir compte du contenu des sites, c'est trop facilement manipulable, les webmasters pourraient se mettre à écrire Bon c'est malin ça, je me suis pi**é dessus!
Cendrillon Posté 12 Janvier 2006 Posté 12 Janvier 2006 D'ailleurs les moteurs ne devraient pas tenir compte du contenu des sites, c'est trop facilement manipulable, les webmasters pourraient se mettre à écrire <{POST_SNAPBACK}> ben si justement, et c'est là où je voulais en venir ... je pense qu'il devrait s'intéresser au contenu visible et non au balises (trop facilement manipulables) ... d'ailleurs il me semble bien que c'est ce vers quoi tend Google : extraire du contenu visible les mots clés, la thématique et la sémantique ...
Sebastien Posté 12 Janvier 2006 Posté 12 Janvier 2006 Ce serait un gros retour en arrière : à l'origine les 1ers moteurs plein texte indexaient le contenu en vrac en se fichant du balisage...
Cendrillon Posté 12 Janvier 2006 Posté 12 Janvier 2006 La première question que j 'ai envie de te poser c'est pourquoi douterais-tu de l'importance du poids de cet élément? Crois-tu réellement que pour trois manières d'écrire un titre soit : <h1>Titre de la page</h1> <p style="font-size: 125%; font-family: verdana; font-weight: bold;">Titre de la page</p> <font face="verdana" size="5"><b>Titre de la page</b></font> Que pour Google ce soit du pareil au même? Que le moteur est assez intelligent pour comprendre que c'est un titre, donc un identifiant de contenu? Personnellement, j'en doute fort. encore une fois, d'un point de vue théorique, je suis d'accord avec toi sur l'utilité des balises sémantiques... mais il ne faut pas oublier que les moteurs sont également confrontés à la réalité (le spam) dont ils ne peuvent s'exonerer et que ce qui est bon d'un point de vue théorique ne l'est pas forcément dans la pratique ... c'est pour cela et pour les raison que j'ai essayé de développer plus haut que je ne pense pas que ces balises n'aient un poids important en regard de l'ensemble des élements pris en compte dans le positionnement d'une page ... mais ce n'est que mon avis ... Il y a une différence fondamentale entre les éléments hx et les balises meta. Les balises metas n'ont aucune valeur sémantique, mais plutôt une valeur de meta-information ce qui est complètement autre chose. De plus, contrairement aux éléments HTML contenus dans le <body>, il n'y a aucune association directe entre le contenu d'une balise meta et le véritable contenu d'une page Web. C'est pourquoi ces balises ont rapidement perdu leur raison d'être et leur pertinence et que l'on peut encore discuter de la pertinence des éléments avec une réelle valeur sémantique. je n'ai pas dit qu'il n'y avait pas de # entre des balises sémantique et des balises meta ... j'ai juste voulu dire : "même motif, même punition" ... Bon c'est malin ça, je me suis pi**é dessus! ben c'est du propre ça ...
Cendrillon Posté 12 Janvier 2006 Posté 12 Janvier 2006 Ce serait un gros retour en arrière : à l'origine les 1ers moteurs plein texte indexaient le contenu en vrac en se fichant du balisage... <{POST_SNAPBACK}> il me semble au contraire que lorsque les moteurs sauront extraire du texte visible : les mots clés (c'est déjà fait), la sémantique et la thématique nous aurons fait un grand pas en avant ...
Denis Posté 12 Janvier 2006 Posté 12 Janvier 2006 c'est pour cela et pour les raison que j'ai essayé de développer plus haut que je ne pense pas que ces balises n'aient un poids important en regard de l'ensemble des élements pris en compte dans le positionnement d'une page ... mais ce n'est que mon avis ... Là on est d'accords par contre... je ne crois pas que la sémantique occupe une place privilégiée dans le coeur de Google... ce que je crois là-dessus, c'est qu'à positionnement égal, la sémantique devrait faire une différence (mais que par elle-même, elle ne vaille pas encore grand chose, pas plus que la conformité d'ailleurs). Pour le reste, je suis globalement d'accord avec toi, quand on place justement la question en regard de l'ensemble des éléments pris en compte dans les algorithmes.
Cendrillon Posté 12 Janvier 2006 Posté 12 Janvier 2006 Là on est d'accords par contre... je ne crois pas que la sémantique occupe une place privilégiée dans le coeur de Google... ce que je crois là-dessus, c'est qu'à positionnement égal, la sémantique devrait faire une différence (mais que par elle-même, elle ne vaille pas encore grand chose, pas plus que la conformité d'ailleurs). Pour le reste, je suis globalement d'accord avec toi, quand on place justement la question en regard de l'ensemble des éléments pris en compte dans les algorithmes. <{POST_SNAPBACK}> bon, alors imaginons maintenant que ce poids augmente au point qu'il devienne un élément prépondérant dans le positionnement d'une page ... que risque t'il de se passer ? nous risquons de voir fleurir des pages avec des balises Hx dans tous les sens (on voit déjà des pages avec des balises H1 bourrées de mots clés) ... comment se comporteront les lecteurs vocaux avec de telles pages ? voila le risque que j'évoquais ici ...
Sebastien Posté 12 Janvier 2006 Posté 12 Janvier 2006 C'est bien pour ça que les moteurs multiplient les critères de scoring
Denis Posté 12 Janvier 2006 Posté 12 Janvier 2006 bon, alors imaginons maintenant que ce poids augmente au point qu'il devienne un élément prépondérant dans le positionnement d'une page ... que risque t'il de se passer ? nous risquons de voir fleurir des pages avec des balises Hx dans tous les sens (on voit déjà des pages avec des balises H1 bourrées de mots clés) ... comment se comporteront les lecteurs vocaux avec de telles pages ? Si un tel changement vien un jour à arriver, il faudrait que les ingénieurs de Google soient assez lucides pour prévoir le spam potentiel et juger d'une manière de bien doser la quantité de balises hx par rapport aux contenus... ce qui serait simple d'un point de vue de l'algo, mais terriblement compliqué du point de vue de l'évaluation des risques d'abus de la part des concepteurs. Une page ne peut pas avoir 300 h1, comme je l'évoquais plus tôt dans cette discussion. Quant aux synthétiseurs vocaux, ça ne change rien, l'information pouvant être tout aussi bien lue. Cependant, d'un point de vue d'accessibilité, ce pourrait être catastrophique parce que les utilisateurs faisant appel à ces technologies d'assistance perdraient encore une fois un des indicatifs clairs leur permettant de se faire une image globale du contenu de la page (en assumant bien sûr que les contenus des hx soient pertinents et utilisés dans l'esprit de structure de contenus, comme dans une table des matières). C'est bien pour ça que les moteurs multiplient les critères de scoring Scoring? Bon, c'est quoi ce truc encore?
Cendrillon Posté 12 Janvier 2006 Posté 12 Janvier 2006 il me semblait bien avoir vu un test sur l'impact de la balise H1 sur le positionnement d'une page: le voila ... il date un peu mais bon ...
Sebastien Posté 12 Janvier 2006 Posté 12 Janvier 2006 Par rapport à une requete donnée, Google regarde son index et attribue aux pages un score intermediaire, critère par critère. En gros il attribue des points à ceux-ci : "title : 4 point, anchor text : 2 points etc... Ensuite il multiplie le nombre de point obtenues par le PR pour obtenir le score final.
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant