Tag "robots-nocontent", pour les robots de yahoo

alphega · 4 Mai 2007

Bonjour,

Je n'ai pas vu de sujet qui en parlait sur le hub, cette info pourrait interesser certains webmasters.

Yahoo donne maintenant la possibilité aux webmasters d'aider leurs robots à identifier des parties de pages grace au tag "robots-nocontent" qui est à utiliser comme une classe CSS. Ce tag est à placer sur les blocs qui ne sont pas en rapport avec le thème de la page (menu communs, header, pubs...). Le but est d'aider les spiders de yahoo à extraire et analyser plus facilement le contenu réel de la page.

Quelques précisions suites aux commentaires faits sur le blog de yahoo précisent que les liens contenus dans ces blocs seront suivis normalement sauf s'ils sont affublés d'un "nofollow". Ils encouragent d'ailleurs à utiliser de tels tags pour les aider à identifier le contenu des pages web.

Voici quelques exemples que l'on peut retrouver sur l'aide en ligne Yahoo Slurp:

<div class="robots-nocontent"> This is the navigational menu of the site and is common on all pages. It contains many terms and keywords not related to this site</div>

<span class="robots-nocontent"> This is the site header that is present on all pages of the site and is not related to any particular page</span>

<p class="robots-nocontent"> This is a boilerplate legal disclaimer required on each page of the site</p>

<div class="robots-nocontent"> This is a section where ads are displayed on the page. Words that show up in ads may be entirely unrelated to the page contents</div>

Helpeur · 4 Mai 2007

Mieux vaut rester prudent sur cette fonction :nonono:

Voir : http://s.billard.free.fr/referencement/?20...elle-pertinente

Modifié 4 Mai 2007 par Helpeur

**Régis** · 4 Mai 2007

Bonjour,

J'ai lu cette information et fait un billet sur le blog de Webmaster Hub - Yahoo, class=robots-nocontent

Quelques réferenceurs n'auront plus à utiliser le JavaScript pour faire du texte caché ou du lien caché (que Google n'apprécie guère)...

Si je code ceci :

On discute <span class="robots-nocontent"> de Yahoo et de class</span> robots-nocontent sur Webmaster Hub

Slurp lira : "On discute de Yahoo et de class robots-nocontent sur Webmaster Hub"

L'internaute lira :"On discute de Yahoo et de class robots-nocontent sur Webmaster Hub"

Mais Yahoo ne fera sa recherche que sur :"On discute robots-nocontent sur Webmaster Hub" et n'affichera que cela dans le résultat des requêtes...

Maintenant, quelle sera la réaction de Google ?

[EDIT]Le temps d'écrire ma réponse, je vois qu'Helpeur a donné un lien qui sous-entend la même chose.... comme quoi ! [/EDIT]

australien · 4 Mai 2007

Maintenant, quelle sera la réaction de Google ?

Bonjour a tous et salut à toi Régis :smartass:

Justement, quelle sera la récation de google ?

Est ce que ça vaut le coup de "se mouiller " au risque de mecontenter maitre google ?

Sa réaction ne sera t elle pas de type " punitive" pour ceux qui suivent ouvertement yahoo?

... Dire qu on passe la journée à calculer un robot... :nerd:

Australien a l'ouest :blink:

**Régis** · 4 Mai 2007

Salut Gilles,

Si j'étais...

Si j'étais Google, je laisserai faire (il n'a pas le choix !), je conseillerai probablement de ne pas faire de "robots-nocontent" pour être cohérent avec ma politique (voir le billet "lien caché ") et j'incrémenterai quand même mon algorithme : ce serai pour moi, l'occasion de déceler des webmasters qui ont tendance à utiliser des stratégies que je ne préconise pas...

Perso, j'attends de voir la réaction de Google pour éventuellement adopter..

Sebastien · 4 Mai 2007

Je ne pense pas que Google rejoindra Yahoo dans cette initiative. Il l'auraient fait depuis longtemps car il propose une option équivalent dans leur Search Appliance (moteur de recherche interne pour les entreprises).

Je ne vois aucun interêt à cette balise, comme expliqué dans mon billet. Les exemples donnés par Yahoo sont en plus très bêtes : les éléments de navigation sont un fort signal pour juger de la pertinence, tandis que les scripts de pubs sont déjà la plupart du temps inaccessibles aux moteurs, car basés sur des javascripts...

**Régis** · 4 Mai 2007

Salut Sébastien,

Tout à fait d'accord avec toi...

Mais quelque chose m'interroge : par curiosité, à ton avis, quel est l'intérêt réel de Yahoo à proposer cette class robots-nocontent ?

Sebastien · 4 Mai 2007

Je me le demande à vrai dire... en circuit fermé (intranet) ce pourrait être utile, mais pour le web ?

**captain_torche** · 4 Mai 2007

De plus, les moteurs n'ont-ils pas déjà dans leur algo une méthode pour déterminer le contenu réellement pertinent d'une page ?

Ce serait un constat d'échec de Yahoo ?

**Jeanluc** · 4 Mai 2007

De plus, les moteurs n'ont-ils pas déjà dans leur algo une méthode pour déterminer le contenu réellement pertinent d'une page ?
Ce serait un constat d'échec de Yahoo ?

Exactement, comme le rel=nofollow.

Jean-Luc

yep · 5 Mai 2007

comme les pages web ne sont plus des documents à part entière mais bel et bien des plaquettes commerciales, Googe comme Yahoo sont obligés de patcher leurs algorithmes pour prendre en compte ce déploiement en analysant les éléments redondants des pages qu'ils vont ainsi identifier comme dupliqués (menu, header, footer, etc.).

L'implémentation de cet élément devrait ainsi leur permettre d'analyser plus facilement le contenu des pages mais à quel prix : favoriser le spam ? (d'ailleurs excellent billet Seb)

**Régis** · 5 Mai 2007

Bonjour Yep...

J'ai un peu de mal à te suivre sur cette phrase :

comme les pages web ne sont plus des documents à part entière mais bel et bien des plaquettes commerciales (...)

Que veux-tu dire ?

**Jeanluc** · 5 Mai 2007

J'ai l'impression qu'on tourne en rond. Ces rel=nofollow et ces class="robots-nocontent", c'est en revenir au début du web quand les moteurs de recherche classaient les pages selon les indications des webmasters dans les META "description" et "keywords".

Tout cela ne fait que favoriser les échanges de liens entre entreprises (=webmasters) partenaires et les ventes de liens et cela minimise le poids des liens spontanés. Si les liens doivent encore compter à l'avenir, il faudra que les moteurs de recherche trouvent quelque chose de mieux que des emplâtres sur jambes de bois. :lol:

:clap: à Seb pour son billet!

Jean-Luc

**Régis** · 5 Mai 2007

En tout cas, une chose est sûre.... si de nombreux sites décident d'adopter le "robots-nocontent", cela va donner du travail aux web-agencies...

Soyons positifs et remercions Yahoo ! :hypocrite:

Dudu · 5 Mai 2007

Salut

J'ai l'habitude d'être à contre-courant de l'opinion générale, donc ne changeons pas une formule qui a fait ses preuves:

je suis enchanté par l'arrivée de cette classe :smartass:

Je m'explique, je suis souvent dans le cas de figure présenté par davidm dans ce topic: Masquer seulement une partie d'une page web.

En gros, je souhaiterais pouvoir négocier moi-même ce que je veux faire indexer dans ma page de la même manière que je négocie avec robots.txt les parties de mon site que je souhaite ou non faire indexer.

Donc je vois ça comme un prolongement logique du protocole d'exclusion des robots, je regrette juste que personne n'y ait songé avant, et ça sera toujours plus propre que du cloaking ou du Javascript mal ficelé.

Après effectivement, les possibilités de dérives sont là et je crois n'être pas le seul à avoir trouvé flagrant l'exemple pris par Sébastien.

Mais je pense Yahoo! assez intelligent pour avoir prévu une parade, sinon ils n'auraient certainement pas pris le risque de sortir ça.

Quand bien même, avec robots.txt il est extrêment simple de "piéger" les moteurs:

une redirection Javascript avec timer 0 secondes vers une page d'un dossier interdit par robots.txt. La technique existe depuis longtemps et les moteurs n'ont aucun mal à déceler ce stratagème bidon.

Avec ce principe je peux écrire dans une page "Winnie l'ourson est un petit ours jaune qui aime se faire des tartines de miel" (page lue par les moteurs uniquement en théorie) et faire lire à l'internaute "Winnie l'ourson est un pervers lubrique qui aime se faire donner la fessée par maitresse Miranda"

Je ne vois donc pas bien ce qui peut changer :unsure: (mais je peux me tromper, auquel cas dites-le moi )

Pour finir, un point avec lequel je suis d'accord est que l'exemple donné par Yahoo! avec les menus de navigation est loin d'être pertinent.

PS: on en revient toujours au début du web de toute façon, puisque les meta keywords et description se sont transformés en "nuages de tag" depuis longtemps: c'est exactement le même principe quand on y pense (et les dérives sont les mêmes, il suffit de taper le nom d'une actrice de charme dans youtube ou dailymotion pour constater le nombre de résultats qui n'ont rien à voir)

Connexion

Tag "robots-nocontent", pour les robots de yahoo

Sujets conseillés

alphega

Helpeur

Régis

australien

Régis

Sebastien

Régis

Sebastien

captain_torche

Jeanluc

yep

Régis

Jeanluc

Régis

Dudu

Veuillez vous connecter pour commenter

Parcourir

Activité