Aller au contenu

Sujets conseillés

Posté

Suite à une question de Sébastien Billard sur un article américain sur le sujet, j'ai pu constater qu'effectivement l'utilisation des tagclouds devenait la dernière mode pour améliorer le référencement.

L'idée est d'améliorer le positionnement d'une page sur une thématique donnée en "dopant" la page avec des mots disposant d'un fort taux de cooccurence avec les mots de la page...

S'il s'agit d'un nuage de tags élaboré à partir du contenu d'un site, le gain est anecdotique, car les mots sont déjà présents dans le site. Le fait d'extraire ces mots hors contexte et dans une présentation artificielle peut même avoir une influence néfaste sur le positionnement.

Mais il y'a plus subtil : certains outils proposent des "mots clés" associés à une thématique donnée. Ces mots sont ceux qui ont un fort taux de cooccurence avec, soit ceux de la page, soit ceux de la requête ciblée. Ils sont calculés en fonction d'un corpus autre que celui du site, ce qui permet de découvrir de nouveaux mots.

"Doper" une page pour qu'elle sorte en premier sur une requête donnée en insérant des mots qui ont un fort taux de cooccurence avec cette requête est une stratégie qui marche en général très bien. Une page consacrée à une thématique donnée contient un texte dont le contenu est orienté dans une "direction" proche de celle d'une requête caractéristique de cette thématique dans l'espace vectoriel de Salton. Le fait de "doper" la page permet d'augmenter le rapport signal sur bruit et de rapprocher encore la page de l'axe caractéristique de cette thématique précise.

Le problème de ces outils est qu'ils sont proposés par des gens qui ne connaissent pas bien la linguistique statistique... Quand on calcule les taux de cooccurence de termes sur un corpus, les plus forts taux au dessus du seuil de détection correspondent à des thématiques plus générale que le document étudié, les plus faibles à des sous thématiques. Les résultats "en phase" avec la thématique du document sont au milieu du classement. L'art est de déterminer quels mots clés choisir.

Bref, l'utilisation de ces outils a tendance à dévier l'axe du document, et non de le rapprocher de la "vraie thématique" ciblée.

Le "dopage" par ajout de mots-clés de la même thématique est donc une arme difficile à utiliser. La solution la plus simple est en général d'utiliser des méthodes plus naturelles de rédaction.

Voilà. Ces éléments résultent d'échanges de MP avec Sébastien, il me semblait dommage de ne pas en faire profiter la communauté.

Posté

Bonjour,

Si j'ai bien compris ça peut aider sur un site avec une thématique bien définie.

Si j'ai un blog sur les animaux et que dans mon tag cloud j'ai uniquement des mots tels que "chat, chien, cheval, spa, animal..." ça peut être pertinent.

Posté

Tu a bien fait de partager cette info Phillipe. Pour préciser l'outil en question est Quintura, une interface d'aide à la recherche qui propose des termes "sémantiquement proches" pour préciser ou élargir la requête. Un article suggérait d'insérer dans le contenu les mots-clés connexes proposés par Quintura pour "booster" la visibilité sur le mot-clés principal.

Ceci dit, Quintura reste un bon outil pour chercher (éventuellement) et pour "brainstormer" quand on recherche des mots-clés.

PS : j'ai contacté Quintura pour savoir comment ils déterminaient les mots-clés sémantiquement proches, je vous tiendrais informés s'ils me répondent.

Posté (modifié)

cette inclusion de mots clés dans la page permet en effet de renforcer sa sémantique, mais comme tu le dis Cariboo, cette pertinence sera bien plus accrue via de la rédaction et non ce que l'on peut assimiler à une bonne liste de mots clés, qui pourra être à terme sanctionnable, non ?

Alors pourquoi résourdre un problème de pertinence avec une solution palliative plutôt que préférez résoudre le problème à la source ... :P

Modifié par yep
Posté
(...)Pour préciser l'outil en question est Quintura (...)Ceci dit, Quintura reste un bon outil pour chercher (éventuellement) et pour "brainstormer" quand on recherche des mots-clés.

PS : j'ai contacté Quintura pour savoir comment ils déterminaient les mots-clés sémantiquement proches, je vous tiendrais informés s'ils me répondent.

J'ai testé Quintura très récemment, et je pensais plutôt l'utiliser pour "brainstormer"... :)

Ceci dit, il m'avait semblé comprendre que Quintura fonctionne avec Miva / Espotting...

Posté

Yep, en fait ce "dopage sémantique" est assez difficile à détecter, surtout s'il est inséré dans le corps même du texte !

Pour l'outil de Quintura, il semble qu'ils utilisent comme corpus les snippets des outils de recherche.

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...