Aller au contenu

Similaire ou pas pour Google


Sujets conseillés

Guest Kmenslow
Posté

Bonjour a toutes et tous,

J'espere que vous avez passe de bonnes vacances .

J'utilise essentiellement internet pour chercher des renseignements sur de nombreux sujets que je garde dans un coin de mon DD .

Durant mes vacances, je suis lance dans la construction d'une encyclopedie ou je regroupe sous forme de fiches les renseignements collectes .

Certaines fiches sont completes, d'autres sont vides ( 20 mots maxi ) et d'autres relativement similaire comme par exemple ces 2 fiches :

Fiche sur le Rottweiller et Fiche sur le Dobermann

Les Metas changent peu et le texte aussi ne varie pas beaucoup.

Pensez-vous que ces 2 pages soient considerees comme similaires par GG ?

Existe-t-il un outil pour verifier cela ?

Desole pour le manque d'accents, mon clavier ne me permet pas d'en faire .

Posté

Tu peux le voir à l'aide de la commande "site:" dans Google

Normalement, tu verra la liste des pages indexées :

http://www.google.fr/search?sourceid=navcl...2Efr%2Fannuaire

Quand les pages sont trop similaires, tu aura un résultat qui ressemble à ça :

http://www.google.fr/search?hl=fr&rls=...sadhu&meta=

Note que dans ce cas ça montre une certaine faiblesse de Google, car chaque page a vraiment un contenu original. Mais le schema de nommage des pages (title), la balise meta description générique, et le contenu restreint font que ces pages apparaissent comme similaires.

(Tiens ça me donne une idée de test ça, je vais enlever les meta histoire de voir ce que ça donne ;) )

Posté

Pourquoi "Fiche sur le..." et pas directement "Doberman" "Rottweiller" "Toutou" ?

Je pense qu'il y a plus de requêtes sur ces simples mots que sur "Fiche de toutou" ;)

Sinon je suis dans le même cas que toi ; j'ai un glossaire en ligne dd'env. 2500 pages, chacune correspondant à un terme du dictionnaire. Certaines comportent de nombreux développement. Certaines sont vides ou presque :( ou renvoient sur un homonyme.

Dans un premier tremps GG a réussi à me trouver 21 000 pages ! Là, je ne sais pas comment il a fait. Puis il a tout vidé ou presque (je suis tombé à une 50aine de pages indexées) et là il recommence à référencer page après page. Il en est à un petit peu moins de 1000 mais en ajoute de nouvelles tous les jours.

Posté

Difficile d'être catégorique sur la façon dont Google réagira face à la similarité de ces pages. Ca dépend de beaucoup d'autres facteurs:

- Du nombre de pages construites sur le même modèle sur le site: n'y a t'il que ces 2 pages que tu donnes en exemple ou y en a-t'il des centaines?

- Des backlinks de ces pages: plus les pages seront fortement liées, moins elles aurant de chance d'être filtrées par Google pour cause de similarité

- Du moment: au gré de ses variations d'algorithmes et de filtres, Google peut pénaliser des pages similaires, puis ne plus les pénaliser, puis les pénaliser à nouveau.

Tu as fait l'effort de personnaliser les titres et les métas. Il y est donc possible que "ça passe". Pour mettre toutes les chances de ton côté, tu pourrais aller plus loin dans l'élimination des éléments communs à ces pages. Par exemple:

- Nommer ces pages rottweiler.php et daubermann.php plutôt que chien-rottweiler.php et chien-daubermann.php

- Mettre "DOBERMANN : carte d'identité" plutôt que "DOBERMANN : la carte d'identité de ce chien de race" comme meta description

- Mettre "Dobermann" plutôt que "Dobermann, chien de race, chien" comme méta keywords

- Alléger au maximum ton menu dans ces pages: par exemple ne laisser qu'un lien de retour au sommaire plutôt que les liens vers toutes les catégories.

Le mieux est sans doute de faire des essais et d'observer comment Google réagit. Il n'y a pas de pénalité définitive en la matière.

Guest Kmenslow
Posté
Pourquoi "Fiche sur le..." et pas directement "Doberman" "Rottweiller" "Toutou" ?

Je pense qu'il y a plus de requêtes sur ces simples mots que sur "Fiche de toutou" ;)

Sinon je suis dans le même cas que toi ; j'ai un glossaire en ligne dd'env. 2500 pages, chacune correspondant à un terme du dictionnaire. Certaines comportent de nombreux développement. Certaines sont vides ou presque :( ou renvoient sur un homonyme.

Dans un premier tremps GG a réussi à me trouver 21 000 pages ! Là, je ne sais pas comment il a fait. Puis il a tout vidé ou presque (je suis tombé à une 50aine de pages indexées) et là il recommence à référencer page après page. Il en est à un petit peu moins de 1000 mais en ajoute de nouvelles tous les jours.

Combien as tu de pages reference sur yahoo ?

Difficile d'être catégorique sur la façon dont Google réagira face à la similarité de ces pages. Ca dépend de beaucoup d'autres facteurs:

- Du nombre de pages construites sur le même modèle sur le site: n'y a t'il que ces 2 pages que tu donnes en exemple ou y en a-t'il des centaines?

- Des backlinks de ces pages: plus les pages seront fortement liées, moins elles aurant de chance d'être filtrées par Google pour cause de similarité

- Du moment: au gré de ses variations d'algorithmes et de filtres, Google peut pénaliser des pages similaires, puis ne plus les pénaliser, puis les pénaliser à nouveau.

Tu as fait l'effort de personnaliser les titres et les métas. Il y est donc possible que "ça passe". Pour mettre toutes les chances de ton côté, tu pourrais aller plus loin dans l'élimination des éléments communs à ces pages. Par exemple:

- Nommer ces pages rottweiler.php et daubermann.php plutôt que chien-rottweiler.php et chien-daubermann.php

- Mettre "DOBERMANN : carte d'identité" plutôt que "DOBERMANN : la carte d'identité de ce chien de race" comme meta description

- Mettre "Dobermann" plutôt que "Dobermann, chien de race, chien" comme méta keywords

- Alléger au maximum ton menu dans ces pages: par exemple ne laisser qu'un lien de retour au sommaire plutôt que les liens vers toutes les catégories.

Le mieux est sans doute de faire des essais et d'observer comment Google réagit. Il n'y a pas de pénalité définitive en la matière.

Merci pour ses precieux conseils. :thumbsup: Ce soir je vais faire les modifications adequat .

n'y a t'il que ces 2 pages que tu donnes en exemple ou y en a-t'il des centaines?

Il y a 3 pages comme cela et il y aura maximum 30 pages

Alléger au maximum ton menu dans ces pages: par exemple ne laisser qu'un lien de retour au sommaire plutôt que les liens vers toutes les catégories.

D'avoir le meme menu sur toutes les pages ne permet-il pas de renforcer les pages du menu ?

Posté
D'avoir le meme menu sur toutes les pages ne permet-il pas de renforcer les pages du menu ?

C'est vrai, tant que Google ne pénalise pas les pages pour une trop grande similarité. Le fait d'avoir un menu commun rajoute à la similarité de tes pages. Il faut donc rechercher le point d'équilibre.

Guest Kmenslow
Posté
C'est vrai, tant que Google ne pénalise pas les pages pour une trop grande similarité. Le fait d'avoir un menu commun rajoute à la similarité de tes pages. Il faut donc rechercher le point d'équilibre.

Je comprends .

Merci a tous pour votre aide :thumbsup:

Posté (modifié)

Bonjour à tout le monde,

Et double merci à Jan ;)

Sinon tu peux aussi transformer un inconvénient en avantage en créant un menu flash qui reprend les liens qui napportent rien au niveau référencement, densité.

Par exemple « contact, qui sommes nous, plan du site... »

De plus ce menu pourra être sympa au niveau navigation...

Au plaisir

Franck

Modifié par Franck IDF
Guest Kmenslow
Posté

Google vient d'indexer les pages Dobermann et Rottweiler

La page Dobermann a ete consideree comme similaire a Rottweiler . :nonono:

Question 1 : Lorsque Google compare 2 pages, est ce que la comparaison s'effectue sur l'ensemble du texte ou sur les premieres lignes de la page ?

Question 2 : Une page similaire donc ignoree (site:wwww) , peut-elle apparaitre dans les resultats de Google ?

merci de votre aide

Posté

Les problèmes de duplicate content sont plus complexes qu'il n'y parait au premier abord.

On peut raisonner en termes de pourcentage du texte similaire sur deux pages.

Voici un outil qui permet de comparer deux pages et indique leur taux de "similarité" (c'est pas joli comme expression mais bon)

http://www.webconfs.com/similar-page-checker.php

Mais c'est une approche réductrice.

Certains moteurs identifient les différentes zones de la page : header, footer, nav, contenu principal et il est probable qu'ils ne comparent que ce qu'il est logique de comparer : le contenu principal.

Cf cet intéressant article de Todd Malicoad de stuntdubl :

http://www.stuntdubl.com/2006/06/12/dupe-content/

Guest Kmenslow
Posté

Merci pour ta reponse et ce precieux lien vers l'outil de similitude.

En testant de nombreuses pages je m'apercois que 90 % de mes pages sont similaire (entre 55% et 80% de similitude) :(

Ce qui m'etonne un peu c'est les 27% de similitude entre ma page index et une page descriptive sur le louvre.

Les pub adsense sont elles prise en consideration dans le calcul de la similitude ?

Est ce le menu qui donne ce % eleve ?

Peut-on indiquer a Google ou se trouve le contenu principal de la page ?

J'ai essaye de lire l'article en Anglais mais je ne comprend pas bien l'anglais :P et la traduction Google traduit n'importe quoi.

Posté

Tu peux tenter de structurer ta fiche différemment ou plutôt déstructurer ! En partant du principe que sur un cv il ne faut pas indiquer en titre CV :)

Titres en gras... Chiens : Morphologie : Remarque :

Tu supprimes tout...

Concernant, taille : poids : poil : couleur: tu tentes dajouter Doberman une fois ou deux...

Sinon détailler plus les fiches sur les éléments important mais différents concernant les chiens, mais c'est plus de boulot... !

Enfin suivre les conseils des posts précédents !! LOL ..

Guest Kmenslow
Posté
Tu peux tenter de structurer ta fiche différemment ou plutôt déstructurer ! En partant du principe que sur un cv il ne faut pas indiquer en titre CV :)

Titres en gras... Chiens : Morphologie : Remarque :

Tu supprimes tout...

Concernant, taille : poids : poil : couleur: tu tentes dajouter Doberman une fois ou deux...

Sinon détailler plus les fiches sur les éléments important mais différents concernant les chiens, mais c'est plus de boulot... !

Enfin suivre les conseils des posts précédents !! LOL ..

J'ai apporte les modifications suivant vos conseils et j ai augmente le contenu. L objectif, lors de la creation d'une page, est de ne pas depasse 36% de similitude. Cela marche pas mal ainsi avec 37 pages referencees et seulement 1 en 'similaire'.

Posté

Très bien...

Mais il faut être prudent souvent google met en similaire plus tard...

Sur quelle fiche as tu appliqué nos conseils ?

Au plaisir

FRanck

Posté
En testant de nombreuses pages je m'apercois que 90 % de mes pages sont similaire (entre 55% et 80% de similitude) :(

Les pub adsense sont elles prise en consideration dans le calcul de la similitude ?

Est ce le menu qui donne ce % eleve ?

Peut-on indiquer a Google ou se trouve le contenu principal de la page ?

L'outil webconf est sympa mais incomplet. En effet tu grimpes en % à cause des éléments communs de tes pages, mais le moteur doit faire le tri de tout cela et la similitude devrait porter sur le contenu textuel uniquement.

Guest Kmenslow
Posté
Sur quelle fiche as tu appliqué nos conseils ?

Sur c'est 2 fiches par exemple. Ces 2 pages etaient similaire a 85% car peu de contenu. J'ai rajoute une definition sur le theme en lui meme. La similitude est maintenant de 51 %. Puis j'ai modifier les titres (avant : 'encyclopedie gratuite : les metiers' et maintenant :'les metiers') , les keywords (identiques avant).

http://www.encyclopedie-gratuite.fr/Definition-Loisirs.php

http://www.encyclopedie-gratuite.fr/Definition-Metier.php

On va rapidement rajouter des definitions sur ces 2 pages ce qui fera encore baisser la similitude

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...