Aller au contenu

Sujets conseillés

Posté

Bonjour,

En parcourant ce forum j''ai déjà trouvé une partie des réponses à mes questions et j'en conclus que je suis bon pour une réécriture de certaines pages web. Je cherche qq. idées pour ne pas me tromper.

Le problème de base ( Déjà posé un peu plus bas ):

Le référencement de la page d'accueil m'importe relativement peu, pour moi ce qui est vital c'est que chaque article proposé ( Livres ) se voie référencé par son titre dans les moteurs. Comme les moteurs n'indexent pas ( Ou si ils le font je ne m'en suis jamais aperçu ) le contenu d'une base de données MySql j'ai créé un générateur de pages web qui reprend tous les titres pour en faire un index alphabétique lisible par les moteurs.

Jusqu'au mois dernier ça marchait sans problème, mais depuis qq. temps toutes ces pages ne sont plus visibles dans google ( Le site n'est pas blacklisté la page d'accueuil existe toujours ) . Vu que ces pages étaient un peu loin de la racine du site ( sous répertoires /html/a/index.php, /html/b/index.php ) j'ai pensé que ça pouvait poser problème et j'ai tout refait en ramenant les pages dans la racine et en leur donnant un nom plus explicite ( livres_a.php, livres_b.php, etc ... La page d'accueil porte un lien vers la page index_alpha.php et la page index_alpha.php contient les 26 liens vers livres_a.php, livre_b.php, etc ... ).

J'aurais du lire ce forum avant car faites à partir d'un générateur ces pages ont toutes les mêmes titres et headers et il semblerait que ce soit la raison de leur disparition. Sii ce que j'ai lu ce confirme elles ne risquent pas d'apparaître dans leur nouvelles versions.

Pour différencier les en têtes des 26 pages alphabétiques ce n'est pas un problème. Une petite modif qui mes les noms des auteurs dans les mots clés devrait suffire mais pour les titres des pages ? Jusqu'a quel point doivent-ils se différencier ? Je ne peux quand même pas y coller des trucs du genre "pompes funèbres", "Casse croûte à toute heure", etc ... pour que les 26 soient différentes ? Sur ce point je coince un peu.

Second problème, si il se confirme que google n'aime pas les redirections 302 il va être servi. Comme j'ai déménagé les pages d'origine bien indexées dans les autres moteurs je n'ai guère eu le choix et j'ai un beau .htacces bien chargé au moins jusqu'au moment ou les nouvelles pages seront indexées chez yahoo, msn, etc ... Ici je ne vois guère d'alternative sinon l'erreur 404.

Et une dernière chose qui me laisse très perpexe c'est qu'avec un même nom de domaine je suis référencé chez google deux fois de manière différente. Une fois avec http://bouquinique.com et une seconde avec les www en prime. Je ne sais trop que faire sur ce coup, j'ai commencé un truc sur google sitemap en donnant les deux versions des url's pour chaque page mais je ne sais trop ce que ça va donner.

Si quelqu'un peut me donner qq. idées avant que je n'attaque la xème modification ?

Merci.

Posté

Bonjour,

Pour votre pbre d'indexation dans google avec et sans les www lire :

http://www.wob-wob.com/dotclear/?2005/11/0...ate-content#c17

il s'agit certainement de contenu dupliqué, il faut donc rediriger le nom de domaine sans les www vers celui avec les www. Dan avait expliqué la procèdure dans un post il n'y a pas très longtemps de cela.

Pour les titres des pages, il faut en effet qu'il soit différent sur chaque page, un script php peut générer cela automatiquement.

Pour la redirection 302, on préfère généralement une redirection 301 ou une page 404 contenant un plan du site (plan du site pouvant lui aussi être généré automatiquement via un script php).

Posté
Comme les moteurs n'indexent pas ( Ou si ils le font je ne m'en suis jamais aperçu ) le contenu d'une base de données MySql j'ai créé un générateur de pages web qui reprend tous les titres pour en faire un index alphabétique lisible par les moteurs.

:blink:

Certes les moteurs n'indexent pas les bases de données, mais ils indexent les pages qui sont construites a partir d'une base de donnée (et d'ailleurs les moteurs ne "savent" pas comment les pages ont été construites).

Le gros problème est que tu changes sans arrêt le nom de tes pages. Choisi un nom et une arborescence qui soit "logique" (construite pour les internautes plutôt que pour les moteurs) et tiens t'y.

C'est pas parce que tes fichiers ne sont pas à la racine que les moteurs ne les indexent pas...

Posté

allez, à post fleuve ... réponse fleuve ... tu abordes ici plein de sujets qui mériteraient une discussion entiere pour chacun ...

Comme les moteurs n'indexent pas ( Ou si ils le font je ne m'en suis jamais aperçu ) le contenu d'une base de données MySql j'ai créé un générateur de pages web qui reprend tous les titres pour en faire un index alphabétique lisible par les moteurs.

<{POST_SNAPBACK}>

en gros, et comme l'a dit jeroen, les moteurs n'indexent que ce que peuvent voir les utilisateurs ... si les informations de ta BD sont visibles par les utilisateurs, tu ne devrais pas voir à faires des pages spécialement pour les moteurs, sinon à quoi servent elles ? :whistling:

Vu que ces pages étaient un peu loin de la racine du site ( sous répertoires /html/a/index.php, /html/b/index.php ) j'ai pensé que ça pouvait poser problème et j'ai tout refait en ramenant les pages dans la racine et en leur donnant un nom plus explicite ( livres_a.php, livres_b.php, etc ... La  page d'accueil porte un lien vers la page index_alpha.php et la page index_alpha.php contient les 26 liens vers livres_a.php, livre_b.php, etc ...  ).

<{POST_SNAPBACK}>

les moteurs se fichent complètement de ta structure physique (la seule limite est la taille de l'URL qui ne doit pas dépasser 100 caractères me semble t'il ... à confirmer) ... la seule chose qui les intéressent est la structure logique (qui peut être assimilée à la structure de lien) ... le déplacement physique de tes fichiers était à mon avis un travail inutile) ... ;)

J'aurais du lire ce forum avant car faites à partir d'un générateur ces pages ont toutes les mêmes titres et headers et il semblerait que ce soit la raison de leur disparition. Sii ce que j'ai lu ce confirme elles ne risquent pas d'apparaître dans leur nouvelles versions.

<{POST_SNAPBACK}>

c'est effectivement une bonne raison ... mais je ne vois pas en quoi le fait que tes pages soient issues d'un générateurs implique qu'elles aient les "mêmes titres et headers" ... il suffit d'utiliser les champs de ta BD pour les différencier ...

Pour différencier les en têtes des 26 pages alphabétiques ce n'est pas un problème. Une petite modif qui mes les noms des auteurs dans les mots clés devrait suffire mais pour les titres des pages ? Jusqu'a quel point doivent-ils se différencier ? Je ne peux quand même pas y coller des trucs du genre "pompes funèbres", "Casse croûte à toute heure", etc ... pour que les 26 soient différentes ? Sur ce point je coince un peu.

<{POST_SNAPBACK}>

d'après mon expérience, le taux de similarité entre 2 pages ne dois pas exceder les 70% ...

Second problème, si il se confirme que google n'aime pas les redirections 302 il va être servi. Comme j'ai déménagé les pages d'origine bien indexées dans les autres moteurs je n'ai guère eu le choix et j'ai un beau .htacces bien chargé au moins jusqu'au moment ou les nouvelles pages seront indexées chez yahoo, msn, etc ... Ici je ne vois guère d'alternative sinon l'erreur 404.

<{POST_SNAPBACK}>

si ce n'est pas trop tard, remet tes pages où elles étaient ... ;) maintenant si tu tiens absolument à les avoir à la racine, alors la bonne solution est de faire une redirection 301 (redirection permanente) de l'ancienne position vers la nouvelle.

Et une dernière chose qui me laisse très perpexe c'est qu'avec un même nom de domaine je suis référencé chez google deux fois de manière différente. Une fois avec http://bouquinique.com et une seconde avec les www en prime. Je ne sais trop que faire sur ce coup, j'ai commencé un truc sur google sitemap en donnant les deux versions des url's pour chaque page mais je ne sais trop ce que ça va donner.

<{POST_SNAPBACK}>

redirection 301 de toutes les pages sans le www vers les pages correspondante avec (règle dans le htaccess dont effectivement Dan a déjà donné la syntaxe plusieurs fois) ... ;)

Merci.

<{POST_SNAPBACK}>

ben, il n'y a pas de quoi ... :D

Posté

Déjà merci pour toutes ces réponses qui m'ont appris pas mal de trucs.

en gros, et comme l'a dit jeroen, les moteurs n'indexent que ce que peuvent voir les utilisateurs ... si les informations de ta BD sont visibles par les utilisateurs, tu ne devrais pas voir à faires des pages spécialement pour les moteurs, sinon à quoi servent elles ? :whistling:

C'est la question que je me pose. Peut-être que google n'aime pas la tartine de variables qui suit l'url du moteur de recherche ? Maintenant si il me semblerait logique que google aille chercher dans la base de données une URL en dur du genre:

recherche.php?Find=tous les titres de la lettre A

Comment pourrait-il trouver des données à partir d'un site ou la chaîne de variables déterminant les titres à afficher dépend des entrèes d'un formulaire fourni par l'utilisateur ? Ici un truc m'échappe.

Sinon les pages html générées restent utiles, certains utilisateurs sont largués dès qu'il faut taper 3 mots das un moteur et préfèrent une page alphabétique avec tous les titres.

En tout cas une chose est certaine, lors de la mise en service du site toutes les pages ont été rapidement indexées mais aucun moteur ne m'a indexé un titre avant que je ne fasse ces fameuses pages.

mais je ne vois pas en quoi le fait que tes pages soient issues d'un générateurs implique qu'elles aient les "mêmes titres et headers"

Pour une seule raison, c'est que comme je n'avais pas prévu que des pages aux titres et metas identiques me posent un jour problème j'ai mis un en tête commun pour tous les fichiers. Je vais refaire ça sous peu.

d'après mon expérience, le taux de similarité entre 2 pages ne dois pas exceder les 70% ...

J'en suis très loin seul le titre des pages et les metatags sont identiques. Ce qui m'a interpellé c'est que les pages générées ont disparu de google depuis qu'ils ont changé leur système d'index.

Mais le meilleur reste à dire:

Les pages disparues de l'index depuis 15 jours sont toutes mystérieusement revenues dans la journée. Heureusement que comme conseillé plus haut j'ai fait une 301 vers la nouvelle version et qu'elle marche. Google me rendra fou ( Si ce n'est déjà fait ).

Ceci dit je vais quand même faire les modifs prévues on n'est jamais trop prudent.

Posté
Comment pourrait-il trouver des données à partir d'un site ou la chaîne de variables déterminant les titres à afficher dépend des entrèes d'un formulaire fourni par l'utilisateur ? Ici un truc m'échappe.

Rien ne t'échappe. ;)

Les moteurs ne "remplissent" pas les formulaires. Pour qu'une page soit indexée, il est indispensable qu'elle soit accessible autrement que par un formulaire.

Jean-Luc

Posté
Comment pourrait-il trouver des données à partir d'un site ou la chaîne de variables déterminant les titres à afficher dépend des entrèes d'un formulaire fourni par l'utilisateur ? Ici un truc m'échappe.

<{POST_SNAPBACK}>

ben moi aussi une chose m'échappe ... pourquoi parles tu de formulaire ? je suppose que le formulaire de recherche n'est pas le seul mode d'exploration de ton site ... si tu veux que Google indexe "les titres de chaque livre" (comme tu dis), il n'ira pas explorer tout seul ta Base de donnée, c'est à toi de la développer en générant une page par enregistrement de ta base de donnée ...

je ne sais pas comment est structurée ta base de donnée, mais imaginons que tu ais des champs Auteur, Editeur, Informations sur l'auteur, Pitch du livre, et je ne sais quoi d'autre ... tu pourrais par exemple utiliser le nom de l'auteur et le titre du livre pour le titre de la page, et utiliser les autres champs pour construire une fiche livre ... qui pourrait faire elle même faire un lien vers une fiche auteur qui pointerait a son tour vers tous les livres de l'auteur par exemple ... ;)

Posté (modifié)
je ne sais pas comment est structurée ta base de donnée, mais imaginons que tu ais des champs Auteur, Editeur, Informations sur l'auteur, Pitch du livre, et je ne sais quoi d'autre ... tu pourrais par exemple utiliser le nom de l'auteur et le titre du livre pour le titre de la page, et utiliser les autres champs pour construire une fiche livre ... qui pourrait faire elle même faire un lien vers une fiche auteur qui pointerait a son tour vers tous les livres de l'auteur par exemple ... ;)

En continuant ce raisonnement (et avec un peu de talent), si tu croise tes diférentes tables entre-elles tu arrivera à developper 100 fois plus de pages que ta base ne contient de ligne, et le tout en apportant un réel plus à l'utilisateur.

Et 100 fois plus de pages, ça fait toujours 100 fois plus de points d'entrée sur ton site ;)

Perso Google me référence plus de 100000 pages, je sais pas ou il va les chercher ^_^

Modifié par jeroen
Posté
je ne sais pas comment est structurée ta base de donnée, mais imaginons que tu ais des champs Auteur, Editeur, Informations sur l'auteur, Pitch du livre, et je ne sais quoi d'autre ... tu pourrais par exemple utiliser le nom de l'auteur et le titre du livre pour le titre de la page, et utiliser les autres champs pour construire une fiche livre ...

Oui, c'est exactement ça. Au lieu de faire un truc qui me fabrique des pages html j'aurais sans doute pu me contenter d'une page php qui balaye la base de données pour chaque lettre de l'alphabet sur le champ titre et google aurait sans doute indexé les titres des pages trouvées mais vu qu'en matière de référencement je suis un poil neuneu je n'avais pas vraiment de certitudes alors qu'en sortant des pages normales j'étais certain qu'elles seraient plus ou moins indexées.

Faire une fiche par titre ça me tente bien. Ca permettrait d'avoir le titre du livre en tag et dans le texte donc sans doute un meilleur classement pour la même recherche. Je vais sans doute m'y mettre dans la semaine.

Posté (modifié)
je n'avais pas vraiment de certitudes alors qu'en sortant des pages normales j'étais certain qu'elles seraient plus ou moins indexées.

<{POST_SNAPBACK}>

si ce sont les pages avec paramètres qui te gènent, rien ne t'empêche de les rewritter ... les moteurs n'y verront que du feu ... ;)

ceci dit les pages avec 1 ou 2 paramètre s'indexent très bien maintenant (voir le HUB) ... surtout avec un sitemap ... :whistling:

Modifié par cendrillon
Posté
si tu croise tes diférentes tables entre-elles tu arrivera à developper 100 fois plus de pages que ta base ne contient de ligne, et le tout en apportant un réel plus à l'utilisateur.

Ce que toi et cendrillon voulez dire ce serait Une page du genre:

Tant qu'il y-a des fiches

Lire le titre

Créer un lien /affichage.php?var=montitre

continuer

La logique voudait qu'en indexant la page et en suivant le lien vers la fonction d'affichage google indexe tous les titres un par un mais c'est la question que je m'étais posée quand j'ai commencé le site: Google et les autres peuvent-ils tous suivre ce genre de liens ?

Posté (modifié)
La logique voudait qu'en indexant la page et en suivant le lien vers la fonction d'affichage google indexe tous les titres un par un mais c'est la question que je m'étais posée quand j'ai commencé le site: Google et les autres peuvent-ils tous suivre ce genre de liens ?

<{POST_SNAPBACK}>

je crois bien que j'ai répondu à ta question ... avant même que tu la poses (voir 2 messages plus haut) ... :whistling:

Modifié par cendrillon
Posté
si ce sont les pages avec paramètres qui te gènent, rien ne t'empêche de les rewritter ... les moteurs n'y verront que du feu ... wink.gif

L'url rewriting même si j'en avais entendu parler j'ai découvertr ça seulement aujourdh'ui...

ceci dit les pages avec 1 ou 2 paramètre s'indexent très bien maintenant (voir le HUB) ...

A vrai dire en cas de besoin je pense que je pourrais tout ramener à un seul paramètre constitué d'une seule chaîne de caractères contenant tous les paramètres. Ca fait un gros boulot de modif mais si vraiment il le faut...

Posté
Ca fait un gros boulot de modif mais si vraiment il le faut...

<{POST_SNAPBACK}>

et oui, ce genre de forum, non content de consommer une partie non négligeable des 24 malheureuses heures qui constituent un jour, génèrent souvent un volume de travail non négligeable ...

toi par exemple, après seulement 5 posts tu repart avec plusieurs jours de boulot imprévu ... :fou:

Posté
et oui, ce genre de forum, non content de consommer une partie non négligeable des 24 malheureuses heures qui constituent un jour, génèrent souvent un volume de travail non négligeable ...

Oui, c'est généralement le cas d'un forum qui marche bien.

toi par exemple, après seulement 5 posts tu repart avec plusieurs jours de boulot imprévu ...

En matière d'informatique je me demande si il existe quoique ce soit de prévu.... J'étais tranquille j'étais peinard et j'ai reçu un mail "On ne voit plus tes titres dans google!" petites causes grands effets. Je vais déjà tester une boucle simple pour voir ce que ça sort et comment ça rend. En tout cas très instructif ce forum.

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...