Aller au contenu

Duplicate content - Format PDF et version HTML


Sujets conseillés

Posté (modifié)

Bonjour,

Je souhaiterais mettre le même document en format PDF, ainsi qu'en version HTML. Est-ce que je risque d'être en duplicate content pour les moteurs de recherche ?

Modifié par olitax
Merci d'utiliser le gras et la couleur avec modération ;-)
Posté

le "duplicate content" s'applique pour aux url "classiques" : je ne pense pas qu'une ressource comme un pdf puisse venir concurrencer une url en .html ou .php. Au pire, utilise la technique du canonical... ;)

Posté

Tu auras du mal à insérer une balise "canonical" dans un pdf ;)

Cela étant dit, le seul risque serait de voir un contenu privilégié par rapport à l'autre. Je pense qu'un moteur de recherche privilégiera la version HTML quoi qu'il arrive.

De plus, j'imagine que tu as plus de liens entrants vers la page, donc ça ne devrait pas poser de problème.

Pour résumer, je pense que la version PDF passera en duplicate content. Ce n'est pas pénalisant, vu que ça n'influera pas sur le positionnement de l'autre page.

Posté
Est-ce que je risque d'être en duplicate content pour les moteurs de recherche ?

Non, je pense que Google gère bien les fichiers PDF que les pages html, cependant pourquoi ne pas mettre les liens vers les pdf en nofollow, ou les interdire via robots.txt ! pas la peine d'indexer les deux je suppose !

Posté

Tu auras du mal à insérer une balise "canonical" dans un pdf ;)

Cela étant dit, le seul risque serait de voir un contenu privilégié par rapport à l'autre. Je pense qu'un moteur de recherche privilégiera la version HTML quoi qu'il arrive.

De plus, j'imagine que tu as plus de liens entrants vers la page, donc ça ne devrait pas poser de problème.

Pour résumer, je pense que la version PDF passera en duplicate content. Ce n'est pas pénalisant, vu que ça n'influera pas sur le positionnement de l'autre page.

Merci pour ta réponse. J'aurais qd même préféré que rien ne passe en duplicate content, mais si on ne pt pas faire autrement...

Non, je pense que Google gère bien les fichiers PDF que les pages html, cependant pourquoi ne pas mettre les liens vers les pdf en nofollow, ou les interdire via robots.txt ! pas la peine d'indexer les deux je suppose !

J'ai bien pensé au no follow, mais dans ce cas le texte du lien, qui contient des mots-clés, ne sera pas pris en considération, je pense ? Ce serait dommage, qd on voit leur importance pour le positionnement.

Posté

J'ai bien pensé au no follow, mais dans ce cas le texte du lien, qui contient des mots-clés, ne sera pas pris en considération, je pense ? Ce serait dommage, qd on voit leur importance pour le positionnement.

et bien je dirais au contraire, c'est quoi que tu veux positionner ton html ou ton pdf. la logique voudrait que ce soit le html, donc si ton anchor text du lien vers le pdf n'est pas optimisée je dirais tant mieux

Posté

C'est la page d'accueil sur le site qui serait mieux positionnée, si elle comporte un plus grand nombre de mots-clés dans les textes des liens vers les fichiers pdf.

Autrement, ce sont les pages html correspondant aux documents pdf que je souhaite positionner

Posté

Et pourquoi ne pas mettre directement les liens vers vos pages html ? 'depuis les mots clés' !

c'est fait, mais je souhaitais en mettre encore davantage... je veux peut-être trop bien faire

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...