smile Posté 15 Avril 2005 Partager Posté 15 Avril 2005 Salut, Depuis quelques temps, je vois certaines de mes pages à variables dans Google avec la mention page similaire et aucune description. C'est le cas de mes moteurs de recherche ou annuaire. Si je clique sur page similaire, ca renvoit rien. Comment est déterminé si une page est similaire ou pas ? Si meme description ou titre, est ce suffisant pour qu'elle soit classée comme page similaire ? similaire à une page interne du site ou externe ? vos commentaires sont les bienvenus Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 15 Avril 2005 Partager Posté 15 Avril 2005 Google a surtout du mal à avaler les pages en dynamique. Tous les sites en dynamique sont plus ou moins touchés par ce phénomène. Même l'URL Rewriting n'est pas la solution absolue. Même le Hub est vicitime des pages similaires http://www.google.com/search?hl=en&q=site%...G=Google+Search Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 15 Avril 2005 Auteur Partager Posté 15 Avril 2005 Ok mais est ce néfaste ? Y'a t-il un filtre sur ces pages similaires, ce qui fait qu'on a très peu de chance d'apparaitre en tete de resultats pour ces pages là ? Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 15 Avril 2005 Partager Posté 15 Avril 2005 C'est très dur de positionner des pages en "Pages Similaires". Par contre, si une page déjà positionnée se voit recaler sous ce format, elle ne va pas forcément déscendre dans les résultats. Mais il y a pire encore : "Résultats complémentaires" qui est l'index de garage de Google et là tu n'apparaîs que sur des requêtes hyper spécifiques. Pour être clair, Google est en train de sortir tes pages qui sont en Pages Similaires". Les sauver relève de l'exploit et il faudrait (théoriquement) un lacher de liens (internes et/ou externes) sur ces pages pour leur redonner de l'importance aux yeux de GG, mais ce n'est même pas sûr. Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 15 Avril 2005 Auteur Partager Posté 15 Avril 2005 Ces pages dites "similaires" sont similaires à quoi ? à un titre identique, à une frequence de mots qui se répètent ? Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 15 Avril 2005 Partager Posté 15 Avril 2005 En fait, c'est le lien "cache' qui est parti et il ne reste que le lien "pages similaires". Ce lien "pages similaires" recense des pages d'autres sites qui sont "similaires" d'après Google, mais je ne me suis jamais penché sur la façon dont il effectue un calcul de similarité pour afficher d'autres pages via ce lien. On dirait que c'est basé sur le réseau de liens, mais je n'en sais pas plus. Non, ce qu'il faut retenir c'est plutôt que GG n'affiche plus le lien vers ton cache et ça c'est embêtant. Si la page est toujours en cache, c'est bien planqué et surtout pas affiché dans les résultats, donc il te signifie que les pages ne lui plaisent pas et qu'il veut les gicler. Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 15 Avril 2005 Auteur Partager Posté 15 Avril 2005 J'ai vu que j'avais plus de cache. Enfin si on parle du meme site Je pensais plus vers une similarité de pages internes du à des variables, je viens de mettre un robots.txt pour eviter les doublons ... Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 15 Avril 2005 Partager Posté 15 Avril 2005 Nan, ce n'est pas du tout de ce genre de similarité dont Google parle. Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 16 Avril 2005 Auteur Partager Posté 16 Avril 2005 Alors quel genre de similarité ? On va bien voir avec ce robots.txt ou plutot no index sur certaines pages, voir comment il réagit, parce que sur le site en question, baisse de trafic conséquent ... Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 16 Avril 2005 Partager Posté 16 Avril 2005 Relis mes posts... je t'explique de quelle genre de similarité il s'agit Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 16 Avril 2005 Auteur Partager Posté 16 Avril 2005 Ce lien "pages similaires" recense des pages d'autres sites qui sont "similaires" d'après Google C'est assez vague et ca me dit pas vraiment comment est calculé cette similarité, meme si j'apprecie l'effort que tu fais pour me répondre Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 16 Avril 2005 Partager Posté 16 Avril 2005 Il n'y a rien à savoir de plus. Pages Similaires = des pages web proposant un contenu de même type, abordant le même thème ou un sujet complémentaire. Encore une fois, tu focalises sur ce lien "Pages Similaires", mais ce n'est pas ton problème. Tes pages sont en dynamique non rewrité et ton cache est parti. C'est ça ton souci et pas les "pages similaires" qui est le seul lien qui reste (pas de titre, pas de descri et pas de cache). Je répète ce que je t'ai dis par MP, mais tes pages sont tout bonnement jetées aux oubliettes par GG, malgré le fait que tu persistes à croire que le ? dans l'URL n'est pas le souci. Pourtant, GG ne gobe pas bien du tout le ? et pour les URLs de ce type, tu peux tirer à pile ou face si GG va bien les prendre en compte. Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 16 Avril 2005 Auteur Partager Posté 16 Avril 2005 Je persiste à dire que le ? est un faux problème, j'ai du mal à croire que la techno de Google est incapable à suivre des liens qui ont ? J'ai jamais compris qu'il faille passer en rewriting pour que Google accepte des pages dynamiques, à moins que ca soit voulu, car n'importe quel moteur, le plus basique, n'a pas de soucis pour indexer des pages à ? Oscoop n'a pas de rewriting et il n'a pas de souci de referencement, actifpub non plus ... Alors peut etre que les pages similaires dans mon cas c'est pas le problème, même si je lis à droite ou à gauche qu'un filtre est appliqué aux "pages similaires", donc je m'interroge ... j'ai l'habitude surtout sur le net de vérifier plusieurs fois les sources d'infos proposées, et même si je ne met pas en cause ta connaissance de google, d'autres avis sur le sujet peuvent etre interessants et complémentaires Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 16 Avril 2005 Partager Posté 16 Avril 2005 Ah ouais ? Et le fait que je puisse générer des pages bidons avec le ? ne te donne pas un indice ? -http://www.oscoop.com/?machintruc.azf (par exemple) Il me suffit d'enlever le - devant l'URL et c'est indexé. Pourtant elle n'existe pas cette page. Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 16 Avril 2005 Auteur Partager Posté 16 Avril 2005 Oui et tu veux démontrer quoi ? Si tu fais du rewriting, t'auras aussi des pages bidons : -http://www.oscoop.com/cherche-machintruc.html De passer par ? ou du rewriting, on peut tout aussi bidonner les pages ... Je precise que je bidonne aucune page, que ca soit clair qu'il n'yait pas d'amalgame avec le sujet du depart Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 16 Avril 2005 Partager Posté 16 Avril 2005 (modifié) Je veux montrer que GG ne comprend pas ce qui se passe après le ? Ton cherche-machintruc.html va donner une erreur 404 et pas mon exemple. Tous tes sites sont touchés, contrairement à ce que tu dis. Je vois du "Pages Similaires" partout (je n'avais pas regardé avant). Après, si tu veux continuer de focaliser sur "Pages Similaires" libre à toi, mais je dis et je répète que ton problème vient du dynamique et que ce n'est pas une histoire de contenu semblable ou autre similarité entre les pages. Modifié 16 Avril 2005 par thick Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 16 Avril 2005 Auteur Partager Posté 16 Avril 2005 Ton cherche-machintruc.html va donner une erreur 404 et pas mon exemple Normal puisque Oscoop a pas fait de rewriting, il faudrait un .htaccess à la racine du site et generer le rewriting, mais les conséquences seraient les memes. Page reelle rewriting : http://www.real-rv9.com/complement/index-commande-19.html Page machintruc rewriting : -http://www.real-rv9.com/complement/index-commandemachintruc-19.html Ces deux pages sont similaires d'ailleurs, on y revient Donc quelqu'un pourrait generer des variables qui n'existent pas et qui penaliseraient le site, avec ? ou pas rewriting D'où l'utilité peut etre meme certainement, que je ne faisais pas, c'est de mettre des pages noindex, prevoir les variables exotiques qui pourraient etre generés et qui pénaliseraient le site. En tous les cas je vais m'y employer Lien vers le commentaire Partager sur d’autres sites More sharing options...
thick Posté 16 Avril 2005 Partager Posté 16 Avril 2005 Bon, j'abandonne après ce post. Soit je m'exprime mal ou je ne sais pas, mais pour la nième fois, c'est GG qui capte mal le dynamique (le ? n'est qu'un exemple). Des pages en .htm ont beaucoup moins de chances d'être zappées comme celles de tes sites. Pas besoin de noindex, variables ou autres. Il faut du bon et du pur .htm et je te garantis que le titre, description et cache resteront. Et pour la nième fois (bis) ça n'a rien à voir avec une similarité entre les pages. Le seul cas où tu risquerais une similarité est en mettant en place le Rewrite APRES avoir indexé tes pages en dynamique. Lien vers le commentaire Partager sur d’autres sites More sharing options...
smile Posté 16 Avril 2005 Auteur Partager Posté 16 Avril 2005 Si c'est pas ca, pas grave j'aurais au moins fait le ménage Lien vers le commentaire Partager sur d’autres sites More sharing options...
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant