Aller au contenu

Sujets conseillés

Posté (modifié)

re ,

j'ai un petit sushi avec googlebot qui n'est pas très futé mais peut être trop logique.

Lorsqu'il indexe mes pages , il index 3 écritures différentes (pour le moment ...) de ma pages par exemple :

il index :

-www.monsite.fr/insuma.php?num_langue=7&num_page=79&flash=non <=== Pure invention de google , je sais pas ou il la trouve

et

-www.monsite.fr/insuma.php <=== LA BONNE

et

-www.monsite.fr/insuma.php?PHPSESSID=21722c3eacbe4aa4779485f4cd200818 <=== Pure invention de google , je sais pas ou il la trouve

toutes les 3 sont les mêmes ... elles ramènent a la même page !

Mais je nai besoin que de l'écriture simple !!

j'ai verifié , je n'ai aucun lien avec cette écriture a rallonge !

Comment faire pour que google arrête d'indexer ces pages ?

Redirect 301 ?? mais comment

Modifié par Dan
Posté

Bonjour,

Je vais essayer de deviner. :hypocrite:

il index :

-www.monsite.fr/insuma.php?num_langue=7&num_page=79&flash=non <=== Pure invention de google , je sais pas ou il la trouve

Googlebot ne supporte pas Flash, donc, comme pour toute visite de ton site avec un navigateur sans Flash, le &flash=non s'ajoute à l'URL.

-www.monsite.fr/insuma.php?PHPSESSID=21722c3eacbe4aa4779485f4cd200818 <=== Pure invention de google , je sais pas ou il la trouve

Googlebot ne supporte pas les cookies et beaucoup de scripts ajoutent un numéro de session quand ils sont visités par un navigateur qui n'accepte pas les cookies.

Pas sûr à 100%, mais très probable. ;)

Jean-Luc

Posté

possible ... je ne connais pas grand chose .

en tous cas les liens de mon site pointent vers des adresses simples comme celle en verte.

Comment je fais pour interdire google de faire ces inventions ?

Posté (modifié)
possible ... je ne connais pas grand chose .

en tous cas les liens de mon site pointent vers des adresses simples comme celle en verte.

Comment je fais pour interdire google de faire ces inventions ?

Google n'invente rien, si ces adresses sont indexées, c'est qu'ils les a trouvées dans un lien.

Si tu désactives les cookies dans ton navigateur, tu devrais voir apparaître le PHPSESSIONID. Je suppose qu'en changeant d'autres paramètres, et en parcourant un peu le site pas forcément par le menu principal, on doit pouvoir retrouver les autres paramètres amusants qui sont rajoutés (comme le flash=non en désactivant flash). C'est le script de ton site qui est en cause, et il va falloir le modifier (il est possible que ce soit de grosses modifs) si tu veux vraiment faire disparaître ces url.

En théorie, une session ne devrait jamais être initiée par un lien (methode HTTP GET), mais uniquement après un POST (de formulaire). Comme les robots ne suivent pas les POST le PHPSESSIONID n'apparaît pas, si cette règle était respectée.

Modifié par Lanza
Posté

pourtant jai cherché de partout , ils ne sont pas dans mes pages.

c'est possible avec le htaccess de redireger ces pages à rallonge vers le formet simple ?

si on se connecte sur /voyages.php?********** on soit redirigé sur /voyages.php ?? par le 301 mais de le faire de maniere general

Posté
pourtant jai cherché de partout , ils ne sont pas dans mes pages.
As-tu essayé de visiter ton site avec un navigateur sans Flash comme nous t'avons suggéré ?

Jean-Luc

Posté

jai accédé a mon site par IE cette fois et jai ceci a un endroit :

Vous devez avoir Macromedia Flash. 
<a href="http://www.macromedia.com/go/getflashplayer/"> Obtenir Macromedia FLash
</a> Si c'est deja installe
<a href="index.html?detectflash=false">cliquez ici

c'est une page de photos.

Mais jai le meme prb sur la page d'index de mon site :

/index.php?PHPSESSID=21722c3eacbe4aa4779485f4cd200818

Posté

<?
if($_SERVER["REQUEST_URI"]!=$_SERVER['PHP_SELF'])
header('Location: '.$_SERVER["PHP_SELF"]);
?>

Bon, c'est l'esprit quoi.

Si il y a une requête derrière le .php, on redirige vers la page en .php.

Mais Google n'invente rien, le mieux serait de supprimer le problème à la base.

Posté

je boss sur dreamweaver , jai fais une recherche dans tous les codes source , sur tous le site en local et aucune de ces URL sont sur mon site ...

quand meme bizarre

Posté

jai une sorte de formule mais elle marche pas .

RewriteEngine On
RewriteRule ^(.*)\?(.*)$ $1 [R=301,L]

sinon cela pourrai marcher ?

Posté
sinon cela pourrai marcher ?

Ben non, et pour plusieurs raisons:

- la première est que la query string n'apparaît jamais dans l'expression en premier membre d'une règle

- la seconde est que si cela marchait tu ne pourrais plus avoir aucune URL avec des variables.

Tu dois utiliser un session_start() dans tes sources, et il ne faut pas utiliser cela pour les moteurs, tous simplement.

Dan

Posté

si jai bien compris je met ce code en debut de mes fichiers .php

<?php
/* Ouverture de session conditionnelle, pas pour les robots identifies */

// Spider/Bot pour référencement
$spiders = array( "Googlebot", "crawler", "Slurp", "Fast", "ia_archiver", "Scooter", "Robot", "VoilaBot", "W3C", "ZyBorg", "Deepindex", "xecho" );
$from_spider = false;
foreach($spiders as $Val) {
if (eregi($Val, $_SERVER["HTTP_USER_AGENT"])) {
$from_spider = true;
break;
}
}
// Session ini_set("session.use_trans_sid", "0");
if(!$from_spider) {
session_start();
}

?>

Posté

Tu as parfaitement compris...

Tu mets ce code en lieu et place de l'appel à session_start().

Libre à toi d'éditer la liste des moteurs.

Dan

Posté
Tu mets ce code en lieu et place de l'appel à session_start().

pourrais tu mexpliquer ce que signifie session_start() ? , je le trouve pas dans le code de mes pages

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...