n00by Posté 17 Avril 2008 Posté 17 Avril 2008 Bonjour à tous ! La semaine dernière, j'ai vu sur un article que Google allait "rentrer" dans les formulaires pour mieux crawler le site. Il me semble qu'il soit passé sur un de mes sites puisque depuis mercredi google (via webmaster tools) me renvoi pas moins de 2925 erreurs 404 qui correspondent...à des recherches ! Le problème est que ces pages existent bien, elles renvoient un code 200 dans l'entête http... Cela n'a entrainé aucune pénalité dans mes classements... Quelqu'un rencontre-t-il le même "problème" ?
captain_torche Posté 17 Avril 2008 Posté 17 Avril 2008 Où as-tu trouvé ton article ? Il me semble très étrange qu'un robot puisse valider un formulaire.
Régis Posté 17 Avril 2008 Posté 17 Avril 2008 Où as-tu trouvé ton article ? Il s'agit d'un article de "google webmaster central" du 11/04/08 : Crawling through HTML forms A votre avis qu'est-ce que GG entend par "high-quality site" ?
Le-juge Posté 17 Avril 2008 Posté 17 Avril 2008 Perso je suis un peu du meme avis que Captain Torche. Ca me semble difficile de valider un formulaire pour un outil de recherche. Jusqu'a present pour les formulaire en "get" c'etait pas bien complique de faire indexer tout ca
captain_torche Posté 17 Avril 2008 Posté 17 Avril 2008 Après lecture du document, je reste dubitatif, en effet. For text boxes, our computers automatically choose words from the site that has the form. Pour les champs de saisie, nos ordinateurs choisissent automatiquement des mots depuis le site contenant le formulaire. ( Source) Je ne doute pas que leurs algos puissent trouver des mots-clés pertinents, mais je doute que les mots trouvées soient ceux des pages inaccessibles.
n00by Posté 17 Avril 2008 Auteur Posté 17 Avril 2008 Euh, voici qui dévie un peu le sujet, ce qui montre que je dois être le seul... En fait j'ai des noms de marques qui sont inscrit dans ma page d'accueil ainsi qu'un moteur de recherche par marque a coté (formulaire de recherche avec 6 paramètres différents) et je ne vois pas où il aurait trouvé ces 2900 liens puisqu'il n'y en a pas ! Perso pour moi : high-quality site = site professionnel à assez fort trafic, pour pas que le webmaster amateur s'inquiète de son petit formulaire de recherche.
slender Posté 18 Avril 2008 Posté 18 Avril 2008 salut, Pour les utilisateurs d'adsense il existe depuis peu la possibilité de renseigner un ensemble de paramètres et une URL d'authentification pour permettre permettre au robot d'exploration AdSense d'accéder aux pages qui nécessitent une procédure de connexion. Il faut renseigner l'URL de la page à accès restreint, l'URL d'authentification, la méthode d'authentification (GET ou POST ou normal (.htacces)), définir ensuite les différents éléments du formulaire par leurs caractéristiques (nom utilisateur ou password ou autre) et les valeurs que l'on veut leur attribuer. La vérification spécifique de la page s'effectue grâce à, soit une balise META à inclure dans le code, soit par le biais d'un fichier HTML. L'accès aux page décrivant ce processus d'authentification des URL à accès restreint se fait en cliquant le lien "Authentification du site" de l'alerte NEW qui apparaît en haut de la page des revenus du jour: NEW Vous utilisez AdSense sur des pages protégées par une procédure de connexion ? Aidez-nous à explorer votre contenu à l'aide de la fonctionnalité Authentification du site.
n00by Posté 18 Avril 2008 Auteur Posté 18 Avril 2008 Je suis en train de penser à quelque chose, suite à mon problème... Le fait qu'il y ai un google analytics installé n'aiderait il pas google à "recenser" les pages que les internautes visitent pour aller les visiter après ?
captain_torche Posté 18 Avril 2008 Posté 18 Avril 2008 nooby : c'est parfaitement probable, effectivement Mon site (encore en développement) est dans l'index de Google alors qu'il n'y a aucun BL sur la toile qui y mène, simplement parce que j'ai installé analytics dessus.
Théo B. Posté 18 Avril 2008 Posté 18 Avril 2008 Google utilise, il me semble, des mots-clés du site pour valider ses formulaires. http://www.leblogduwebmaster.com/google-re...mulaires-11.htm Ceci explique cela. De toutes façons, comme dit sur le blog, ces erreurs n'impacteront pas sur ton référencement.
Jeanluc Posté 21 Avril 2008 Posté 21 Avril 2008 Pour info, j'ai un site où Googlebot s'amuse à envoyer des requêtes sur le moteur de recherche interne. Suite à cette création d'URL de recherche interne, maintenant déjà, 1/3 des pages indexées sont des pages de résultats de recherche interne. Comme certaines recherches ne trouvent qu'une seule page, le risque de duplicate content n'est peut-être pas négligeable. De plus, certains visiteurs ne vont pas comprendre qu'un moteur de recherche (Google) renvoie sur un autre moteur de recherche (interne). Où est le gain en pertinence ? Je pense que ça va agacer. Demain, je mets ces pages de recherche en "noindex, follow". Jean-Luc
Leonick Posté 24 Avril 2008 Posté 24 Avril 2008 Il me semble très étrange qu'un robot puisse valider un formulaire.et les robots spammeurs, ils font comment ?
captain_torche Posté 24 Avril 2008 Posté 24 Avril 2008 Je voulais sous-entendre qu'il le fasse intelligemment Rien de plus facile que de valider un formulaire pour ajouter de la pub dans un livre d'or !
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant