Aller au contenu

Sujets conseillés

Posté

Bonjour à tous,

Après avoir fait quelques recherches, je ne trouve pas vraiment de réponse à ma question.

Aussi, je me permets de vous la poser :

Est-il possible d'avoir un sitemap créé à partir de l'url de base de mon site ET de créer un sitemap à partir d'autres pages web de mon site.

En fait, mon patron voudrait garder le sitemap de base, mais en générer d'autres pour que les robots puissent crawler le site comme il faut. Moi, je suis incapable de lui répondre :shutup: car je n'y connais toujours pas grand chose...

En gros, j'avais généré un sitemap à partir de cette page : ***

Et je voudrais savoir s'il est possible de générer un nouveau sitemap (qui viendrait s'ajouter à l'autre) à partir de cette page : ***

Merci d'avance pour vos réponses !

Nanaruto

Posté

Un sitemap XML (avec le protocole sitemap) ou un sitemap "à l'ancienne" juste en html ?

De toute façon dans les deux cas, oui il est possible de créer plusieurs sitemap

Posté
Un sitemap est censé lister toutes les pages d'un site, pourquoi vouloir en faire deux ?

Hello Captain Torche,

Alors, en fait, je ne suis pas certaine d'avoir très très bien compris ce que m'a dit mon chef concernant le pourquoi d'un second sitemap mais je vais tenter de te dire ce qu'il m'a dit (mais ca risque d'être un peu long !)

En fait, on est bien référencé sur notre requête principale mais on aimerait progresser sur la requête principale + donnée géographique (ex : mobilier de bureau AIN). Il y a donc un truc qui a été mis en place (le nom m'echappe) dans le code où on n'a tous les départements de France listés qui s'affichent en bas de page et quand on clique sur un département, on est dirigé vers une version du site qui dit "mobilier de bureau AIN" (pour reprendre l'exemple)

Si tu vas sur : *** et que tu vas en bas de page, il y a tableau puis une sorte de footer avec les départements. Si tu cliques sur un département (ex : l'AIN), tu es redirigé vers la page d'accueuil du site mais dans le titre il y a marqué "mobilier de bureau AIN".

Pour être sûr d'être mieux référencé sur ces données géographiques, il pense donc que faire un sitemap de cette page en particulier permettra aux robots de mieux tenir compte du code inséré qui permet de faire ca et donc d'optimiser notre site pour ce type de requête.

Est-ce que c'est compréhensible, car même moi je ne suis pas sûre de me comprendre ?!!!

Est-ce que cette démarche présente une utilité quelconque ou bien ?

Apparament, non, mais maintenant qu'il y a un peu plus de détails, peut-être pourrez-vous m'en dire plus ?

Merci pour vos réponses :)

Un sitemap XML (avec le protocole sitemap) ou un sitemap "à l'ancienne" juste en html ?

De toute façon dans les deux cas, oui il est possible de créer plusieurs sitemap

Il s'agirait d'un sitemap XML, enfin, je crois. C'est un fichier que je génère à partir de GSiteCrawler. Il s'affiche, sous forme de tableau, mais après un collègue le "touche" pour qu'il apparaissent sous cette forme :

<?xml version="1.0" encoding="UTF-8" ?>

- <urlset xmlns:xsi=&quot;http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=&quot;http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0....temap.xsd" xmlns=&quot;http://www.sitemaps.org/schemas/sitemap/0.9">

- <url>

<loc&gt;http://www.***.com/</loc>

<lastmod>2007-01-01</lastmod>

<changefreq>weekly</changefreq>

<priority>0.8</priority>

(je mets juste le début parce que c'est vraiment trop long !)

Posté

Il va falloir dire à ton patron d'arrêter ça tout de suite ;)

Sa technique n'est pas du tout utile, et elle risque même de vous être néfaste !

Elle n'est pas utile, parce que seuls deux mots sont ajoutés dans la page, qui sera par conséquent considérée comme duplicate content par Google.

Elle peut être dangereuse, parce que Google peut considérer cela comme une tentative de SPAM.

Posté

et attention aux injections XSS sur votre système.....

Je t'envoi les détails par MP....

b0b0

Posté (modifié)
Il va falloir dire à ton patron d'arrêter ça tout de suite ;)

Sa technique n'est pas du tout utile, et elle risque même de vous être néfaste !

Elle n'est pas utile, parce que seuls deux mots sont ajoutés dans la page, qui sera par conséquent considérée comme duplicate content par Google.

Elle peut être dangereuse, parce que Google peut considérer cela comme une tentative de SPAM.

Ok, je comprends. Je n'avais pas du tout pensé au duplicate content. Mais par contre, le code est déjà en place depuis longtemps, il veut simplement s'en servir pour optimiser le référencement sur les données géogrphiques et donc avoir un sitemap pour ça.

Est-ce que si google considérait ca comme du duplicate content il ne l'aurait pas déjà fait ?

Par contre, je ne comprends pas trop le coup du Spam. Qu'est-ce qui serait du Spam ? Le deuxieme sitemap ou la redirection vers un site incluant "mobilier de bureau DEPARTEMENT" ? Parce que je sais pas si tu as remarqué, une fois que tu as cliqué sur le nom du département et que tu es dirigé vers la page d'accueuil renommée, si tu vas tout en bas, tu as un nouveau "nuage de mots" avec le nom de toutes les villes du département cliqué. Tu es alors redirigé vers une ancienne version du site avec marqué... je te le donne dans le mille... Mobilier de bureau + NOM DE LA VILLE

Moi, je pense que personne ne clique dans ces espaces de listes linéaires en bas de pages mais lui y tient. Alors bon. c'est lui le patron, moi je m'incline, mais je pense qu'il ne changera pas d'avis.

Merci encore !

Nanaruto

*Message édité : Régis m'a fait trop peur !*

Modifié par Nanaruto
Posté
Et il ne voulait pas faire plusieurs sitemaps en fonction des support: (vidéo, news, etc...)

Hello et merci pour ta réponse !

Non je ne crois pas car nous n'avons pas de support vidéo sur notre site.

En fait, il veut être sûr que les robots de Google crawlent bien la totalité du site y compris les pages avec les departements et celles d'apres, avec les villes des départements pour que nous soyons présents sur les requêtes "mobilier de bureau + données géographiques"

C'est à dire que si quelqu'un cherche du mobilier de bureau dans l'Ain et tape "mobilier de bureau ain" dans Google, il tombe sur notre site qui est lui, premier sur la requête "mobilier de bureau".

J'ai déjà eu une réponse comme quoi il était possible de mettre deux sitemaps sur un même site internet mais pas associés à la même page, mais est-ce bien utile ?

Je ne sais même pas si le sitemap du site prend en compte les dites pages où s'affichent "Mobilier de bureau - DEPARTEMENT".

Bref. Je suis complètement perdue, et vu que je suis toute débutante, ca n'aide pas !

:(

Posté

Bonjour 'Nanaruto',

Si tu souhaites mettre en place plusieurs sitemap XML : oui cela est possible => GG le dit clairement :

"Vous pouvez fournir plusieurs fichiers Sitemap, sachant que pour chacun d'eux le nombre d'URL est limité à 50 000 et que la taille de chaque fichier ne doit pas dépasser 10 Mo (10 485 760 octets) avant compression. Ces limites contribuent à éviter la surcharge de votre serveur Web lors de la présentation à Google de fichiers volumineux.

Si vous voulez répertorier plus de 50 000 URL, vous devez créer plusieurs fichiers Sitemap. De même, si vous pensez qu'à terme votre plan Sitemap risque de compter plus de 50 000 URL ou de dépasser les 10 Mo, vous pouvez envisager de créer d'emblée plusieurs fichiers. Si vous procédez ainsi, pensez à répertorier vos différents plans Sitemap dans un fichier d'index Sitemap. Les fichiers d'index Sitemap ne peuvent pas compter plus de 1 000 plans."

Je ne suis pas sûr d'avoir bien compris l'objectif de ton boss...

Mais comme dit plus haut, j'attire ton attention sur le duplicate content (toutefois GG semble mieux gérer le DC intra-site qu'inter-site)...

En parlant de ton boss.... ne penses-tu pas qu'il pourrait être amené à lire ce topic si par exemple, il regarde l'origine, aujourd'hui, des entrées vers son site... :shutup:

Posté

Je rejoint Captain Torche sur le système mis en place, à terme, il fera plus de mal que de bien, a éliminer de suite : Google n'aime pas les listes de mots clé comme celle-ci, cela faisait partie des techniques pour tromper Google il y a quelques années, et du coups, aujourd'hui, Google pénalise ceux qui utilisent ce type de technique. Le contenu dupliqué (ce qui est clairement le cas avec la page d'accueil) n'est pas du tout apprécié par Google non plus, même punition. Au final, le site avec ce système va cumuler les pénalité, et risque de rapidement se retrouver déclasser.

Pour résumer : NE PAS CHERCHER A TROMPER GOOGLE

En plus en y ajoutant le problème qu'a soulevé b0b0, la sécurité du site est sacrément précaire, va falloir sérieusement revoir la copie.

En fournissant les bon arguments, ton boss devrait en toute intelligence retirer ce système.

Posté (modifié)

... alors qu'il est si simple de RTFM (sitemaps.org).

Modifié par yep
Posté

Bonjour à tous !

Je suis désolée de ne répondre que maintenant.

J'ai signalé la faille de sécurité du site à mon boss... mais il ne semble pas vouloir considérer ce probleme comme important. Je crois qu'il n'a pas vraiment compris en quoi il y avait une faille de sécurité. J'avoue que moi non plus, mais quand je lui ai envoyé le message de b0b0 avec toutes les données, il m'a envoyer bouler.

Pour répondre à Régis : le but de mon boss, c'est que Google prenne en compte toutes les pages générée poru chaque département puis pour chaque ville, histoire qu'on ait un très gros site avec beaucoup de page et beaucoup de contenu.

J'ai bien compris l'histoire du duplicate content, mais selon mon boss, c'est limite des bêtises puisque "on a toujours fonctionné comme ca et on est premier sur notre requete et on a un PR de 4", donc il est sceptique concernant les éventuelles penalités pour le contenu dupliqué...

J'avoue que je ne sais pas trop quoi faire. ll me semble qu'on a un prestataire qui s'occupe de la base du site mais aussi de l'infogérance, je pense qu'il aurait été intéressant d'avoir leur avis mais mon boss ne veut pas leur parler. Pourtant, j'ai parlé à un autre collègue qui s'y connait bien en informatique, et il m'a dit qu'il faudrait les appeler, mais à mon échelle, je ne veux pas aller à l'encontre des décisions de mon boss.

Sinon, pour les deux derniers posts, je ne sais pas très bien comment les prendre. Je veux bien lire le manuel mais quand on ne sait même pas quoi chercher, ni pourquoi, ni comment, c'est un peu pas évident, d'autant que je ne maîtrise pas (encore) le langage, la formulation et le vocabulaire associés au référencement.

Un peu de compassion pour quelqu'un qui est un peu vraiment perdu ?

Dans tous les cas, je vous remercie d'avoir répondu à ma question, et m'excuse de vous avoir importunés avec ma question idiote.

Nanaruto :shutup:

Posté
le but de mon boss, c'est que Google prenne en compte toutes les pages générée poru chaque département puis pour chaque ville, histoire qu'on ait un très gros site avec beaucoup de page et beaucoup de contenu.

En fait, ton boss crée effectivement beaucoup de nouvelles pages, mais pas de nouveau contenu (le contenu est strictement identique sur les autres pages, à UN mot près). Les moteurs considèrent donc ces pages comme du "contenu dupliqué", et ne les présenteront tout simplement jamais. Elles ne servent donc simplement, strictement à rien. Dans l'état actuel des choses ce n'est pas pénalisant, mais ça n'apporte strictement rien de plus.

Pour faire simple, il faut se mettre à la place du client potentiel : qu'est ce que ça lui apporte de consulter une page spécifique pour sa ville/région, si on lui propose les mêmes offres que sur les autres pages ? Du moment qu'il est livré, il s'en fiche complètement.

Posté

Hello Captain ! Merci (encore) pour ta réponse.

Pour tout te dire, moi non plus je ne trouve pas ça vraiment pertinent d'autant que la requête par laquelle les prospects arrivent sur notre site est "mobilier de bureau". Et puis c'est une requête plutôt recherchée dans Google de toute manière (j'ai regardé dans google trends), bien plus que "mobilier de bureau" + "departement".

Mon boss lui voudrait être sûr que les personnes qui tapent "mobilier de bureau isere", par exemple, tombent sur la page d'accueuil du site avec le mot Isere qui apparait en plus. Il trouve que ca rajoute un peu de proximité et que ca rassure l'utilisateur.

J'ai demandé à un des collègues qui a acces à l'interface du site internet (moi je n'y aurait jamais acces) et il m'a dit que si on faisait indexer les pages département + villes, notre site internet aurait 15 000 pages en plus !

Comme je disais, mon boss ne semble pas réceptif au "duplicate content", pour lui, c'est un concept qui s'apparente à une légende urbaine puisque "personne ne connait vraiment les criteres de Google", donc je pense qu'il doit se dire qu'il faut quand même essayer...

Ce qui est délicat, dans ma position, c'est que je n'y connais strictement rien et qu'il le sait. C'est d'ailleurs pour ça qu'il m'a embauchée, je suis maléable, je n'ai pas de travers choppés autre part puisque c'est mon premier emploi dans ma branche ! Donc tout ce que je peux lui dire, c'est de la gnognotte, ca n'a pas de valeur vu que je suis une newbie.

Je lui avance les arguments que vous me donnez, mais il a toujours un :

- "et pourquoi on est premier ?"

- "et pourquoi on a un PR4 ?"

- "et pourquoi ca a marché jusqu'à présent ?"

- "et pourquoi on n'a pas été desindéxé avant alors ?"

Et je ne sais vraiment pas quoi lui répondre à part que j'ai posé la question dans un forum spécialisé, ce à quoi il me répond : très bien, mais vous connaissez ces gens, qu'est-ce qui vous dit qu'ils s'y connaissent mieux que vous et moi ?

Bref. Voilà. Tout ca pour dire que, Captain, tu prêches une convaincue.

Déjà, moi, d'un point de vue communication (ma branche initiale), je trouve ca inutile au possible alors d'un point de vue référencement, j'imagine que c'est pareil !

Pour moi, personne ne va s'aventurer à chercher son département puis sa ville dans un nuage de mot clé en bas de page. Personne ! Et quand bien meme quelqu'un le ferait, la personne prendrait peur une fois la redirection effectuée sur l'ancienne version du site (la nouvelle version est clean, mais quand on clique sur le département puis sur le nom de la ville, on tombe sur la version pourrie d'il y a 3 ans. Une horreur.)

Je suis tout de même contente que même en y connaissant rien, j'en arrive aux mêmes conclusions que vous, les pro !

Posté

Bonjour 'Nanaruto',

Comme je te le disais plus haut GG gère mieux le Duplicate Content "intra-site" que "inter-site"...

Voici 2 traductions partielles d'un billet de GG sur ce sujet :

Le contenu en double nentraîne pas de conséquences négatives particulières pour votre site sauf si lobjectif semble être de tromper et de manipuler les résultats des moteurs de recherche. En cas de problèmes de contenu en double, et si vous ne suivez pas les recommandations indiquées, nous nous chargeons de choisir la version du contenu à afficher dans nos résultats de recherche.
- Lorsque nous détectons un contenu dupliqué, comme des variations dans les adresses, nous regroupant les différentes adresses.

- Nous sélectionnons ce que nous pensons être ladresse la plus représentative du groupe pour lafficher dans les résultats.

- Nous appliquons alors les propriétés de toutes les adresses contenues dans un groupe à ladresse que nous avons choisi, comme la popularité.

C'est GG qui le dit.... pas des pros...lol

L'article original est là : http://googlewebmastercentral.blogspot.com...nt-penalty.html et tu peux lire en complément http://googlewebmastercentral.blogspot.com...te-content.html

Posté

C'est sûr que pour une débutante, tu fais preuve d'une démarche intellectuelle très sympathique ;)

Sinon, pour répondre aux questions de ton patron :

- "et pourquoi on est premier ?"

- "et pourquoi on a un PR4 ?"

Parce que, mine de rien, le site est très bon

- "et pourquoi ca a marché jusqu'à présent ?"

Ca ne marche pas : la preuve, en tapant "mobilier de bureau isère" dans Google, le site apparaît bien en première position (voir réponse à la question précédente), mais dans sa version "de base" : le critère géographique n'est pas pris en compte (le mot-clé est tout simplement ignoré)

- "et pourquoi on n'a pas été desindéxé avant alors ?"

Parce que ça n'est pas une démarche répréhensible. Google détecte simplement le contenu dupliqué, et n'affiche et ne comptabilise qu'une seule page. Les autres sont simplement ignorées.

Posté

Hello vous deux !

Régis, merci pour les liens ! Je ne savais pas que google avec un blog ! Je sens que je vais avoir de la lecture cette semaine !

Quand tu dis que GG gere mieux les duplicate contents intra-site que inter-site, ca veut dire qu'il arrive mieux à discerner les contenus identiques sur un meme site que entre deux (ou plusieurs) sites ? Parce que je me posais une question, sur notre site de *** on a repris du contenu de France Burea, meme mise ne forme. Tu pourras "comparer" sur *** et sur **

Est-ce que c'est du duplicate content ? Ne faudrait-il pas repenser le textuel pour le site le moins ancien (**) ?

Captain Torche, merci pour tes encouragements. En fait, j'essaie de fonctionner comme un utilisatrice. En communication, il faut se mettre à la place des prospects et clients car sinon, on fait un flop. Pour un site internet (c'est aussi un peu de la com), c'est pareil, ca sert à rien d'être premier sur une requete si le site est un enfer à naviguer ! En plus, pour nous, notre site est notre showroom, donc si ce n'est pas ergonomique, les gens ne reviendront jamais (et on n'a pas d'autres supports, tous nos catalogues sont en PDF et uniquement en PDF !)

Par contre, j'ai une encore une petite question : quand je tape dans GG "mobilier de bureau corse", on est premier, mais quand on clique sur le lien, on tombe sur la vieille version du site internet avec la mention "corse"... alors que quand je tape "mobilier de bureau isere", on est troisieme (toi tu dis premier, mais chez moi on est troisieme !) et on tombe effectivement sur la version actuelle du site sans la mention "isere" nulle part. C'est bizarre, mais ca serait dû à quoi ?

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...