-
Compteur de contenus
2 003 -
Inscrit(e) le
-
Dernière visite
Tout ce qui a été posté par Jeanluc
-
Pour obtenir les résultats que google.co.uk, interrogé en anglais, donnerait, c'est : &gl=uk&hl=en Ton exemple, avec equipe, montre que google donne des résultats différents en fonction de la langue et pas seulement en fonction du pays. Tu peux simuler cela en changeant le paramètre &hl=. Si tu étais en Belgique, tu pourrais tester séparément pour les Belges francophones (&gl=be&hl=fr) et flamands (&gl=be&hl=nl). Pour ton robot, je suppose que tu peux considérer que tous les anglais font leurs requêtes en anglais. Jean-Luc
-
Bonsoir, Pour obtenir les résultats de recherche comme sur google.fr, il sufffit d'ajouter &gl=fr&hl=fr à la fin de l'URL. Quel que soit le data center : - gl : pays - hl : langue Jean-Luc
-
.htaccess est toujours plus sûr que robots.txt qui suppose de faire confiance au propriétaire du robot. Dans un mail reçu aujourd'hui, il affirme respecter robots.txt. A priori quand un propriétaire de robot répond aux emails, c'est bon signe, mais c'est à toi de décider. Jean-Luc
-
Infos recueillies à la source : Je suppose que snap.com beta crawler v0 est une ancienne version de Snapbot/1.0 qui est le seul que je vois circuler actuellement. Jean-Luc
-
Et moi, ça fait des années que j'ai pris le mien en .org... Jean-Luc
-
Je n'avais pas compris qu'il y avait deux user-agents différents ? - robots.txt : le robot le respecte, s'il le souhaite. - .htaccess : le serveur web laisse le robot visiter le site ou pas. Jean-Luc
-
Probleme avec la page 404
Jeanluc a répondu à hebmaster - Forum : Fichier .htaccess et réécriture d'URLs
... sauf que, sur un site sur deux, le robots.txt, n'est pas conforme au standard ou est rempli de lignes inutiles, obsolètes ou néfastes. Par contre, pour le robots.txt du Hub, il n'y a rien à redire: il est court et parfait ! Jean-Luc -
Exclure la plage d'IP complète de PSI qui est un grand ISP américain ne me semble pas la meilleure solution. Je conseillerais plutôt de faire l'exclusion sur base du user-agent. Jean-Luc
-
Bonjour, Je suppose que tu parles de Snapbot. Je cherche, je cherche, mais je n'ai toujours pas de certitude. La piste la plus vraisemblable mène vers snap.com, mais il n'est pas question de ce bot sur leur site. Jean-Luc
-
Probleme avec la page 404
Jeanluc a répondu à hebmaster - Forum : Fichier .htaccess et réécriture d'URLs
Il dit aux robots qu'ils peuvent visiter tout ton site. Donc c'est exactement comme s'il n'y avait pas de fichier robots.txt, sauf qu'il n'y aura plus de 404, évidemment. Jean-Luc -
Probleme avec la page 404
Jeanluc a répondu à hebmaster - Forum : Fichier .htaccess et réécriture d'URLs
Bonjour, A proprement parlé, le serveur ne redirige pas vers la page /erreur.php, mais il affiche le contenu de la page /erreur.php. La nuance est que le serveur renvoie bien un code 404 au navigateur et au robot qui le visite. Il n'y a donc aucun risque que la page /erreur.php soit traitée par un robot comme si elle était le fichier /robots.txt. Si malgré tout, cela t'ennuie, ajoute un fichier /robots.txt contenant uniquement ceci: User-agent: * Disallow: Jean-Luc -
comment rendre index.html prioritaire par / à index.php
Jeanluc a répondu à centreurope.org - Forum : PHP
Ton problème est probablement lié à l'option par défaut pour les permaliens dans WordPress qui est [b]http://www.ton-domaine.com/?p=123. J'ai l'impression qu'en suivant la suggestion de Dudu, tous les liens sont traduits en [i]http://www.ton-domaine.com/index.html?p=123 au lieu de [i]http://www.ton-domaine.com/index.php?p=123. Je suis sûr qu'avec cette indication, un plus-expert-que-moi en ré-écriture d'URL va pouvoir t'aider. Jean-Luc -
Ce n'est pas la même chose. Avec robots.txt, tu dis aux robots de ne pas venir lire certaines pages. S'ils ne viennent pas lire la page, ils ne dévorent pas ta bande passante pour rien et il y a peu de chance qu'ils indexent la page. Avec la META, il faut bien que les robots viennent lire la page pour voir qu'elle contient la META qui leur interdit de l'indexer. Donc, en général, à éviter (question d'efficacité). Jean-Luc
-
Bonjour, Cette adresse est indexable par les moteurs de recherche. Pour s'en convaincre, voir inurl:itemid. J'ajouterais qu'un tiens vaut mieux que deux tu l'auras. Les pages indexées aujourd'hui ont, pour moi, plus de valeur que celles qui le seront peut-être demain. Jean-Luc
-
C'est une balise en rapport avec le Google sitemap : How do I verify my site by adding a meta tag to my site's home page? Jean-Luc
-
Bonjour, Ton hébergeur accepte-t-il que tu accèdes à ton serveur par FTP ? Si oui, as-tu essayé et quel est le message d'erreur exact que tu reçois ? Pourquoi parles-tu de robot.txt dans ton titre ? Tu veux, sans doute, dire robots.txt, mais je ne vois pas le rapport avec ton problème. Jean-Luc
-
Bonjour, Si ton robots.txt contient les lignes: User-agent: * Disallow: /profil il interdit à tous les robots de visiter toutes les URL commençant par /profil, donc, bien entendu, toutes les URL de type /profil*.html. Cela devrait convenir, sauf si tu as d'autres URL commençant par /profil, comme, par exemple, des /profil12345.php. Jean-Luc P.S. Phobos est trop rapide ;-)
-
Ce n'est pas que ce soit impossible de l'afficher plusieurs fois pour un visiteur, c'est qu'elle ne sera payée qu'une seule fois par visiteur unique, même si elle est affichée plusieurs fois. Jean-Luc
-
Bonjour, Etant donné que l'objectif d'un communiqué de presse est d'être communiqué, je ne pense pas que beaucoup d'entreprises interdisent d'en reproduire ou d'en adapter le contenu. Ceci n'autorise pas à copier sans autorisation le contenu d'autres sites (de diffuseur de communiqués). Il suffit que ces autres sites ajoutent quelques éléments originaux dans les textes qu'ils publient pour pouvoir repérer les filous. Jean-Luc
-
Que doit on penser des résultats de Google API ?
Jeanluc a répondu à dircom - Forum : Techniques de Référencement
Bonjour, Google API ne convient pas pour vérifier la position d'un site sur Google, le vrai, dans ses différentes versions de langue, de pays, de data center. Google API est : - un gadget - en version beta depuis une éternité - dont les différences avec le vrai Google ne sont pas documentées (ce serait difficile de documenter l'API sans dévoiler des secrets du vrai Google) - inutilisable pour des applications liées au référencement, - mais intéressant pour quelques applications spécialisées qui ont besoin d'un moteur de recherche. Jean-Luc -
Bonjour, Le premier résultat de cette requête vaut le détour (en train) : Perl split function. A mieux y regarder, ce premier résultat ne fait pas partie de la liste des 10 résultats "naturels". Serait-ce un lien sponsorisé ? Jean-Luc
-
De l'importance des mots, et des phôttes, avec GG
Jeanluc a répondu à xpatval - Forum : Techniques de Référencement
Des fautes d'orthographe dans les liens pointant vers le site est une explication possible, mais plus la seule depuis quelque temps. Si on compare les résultats de : - requête 1 : 24 heur du Mans : 1.940.000 résultats - requête 2 : 24 heurs du Mans : 1.930.000 résultats - requête 3 : 24 heures du Mans : 1.640.000 résultats Il est très peu vraisemblable qu'il y ait autant de fautes d'orthographe dans ces mots simples. Mon avis est que, depuis peu, Google fait des "corrections" orthographiques automatiques sur les requêtes en français. Je ne connais évidemment pas toutes les subtilités de l'algo, mais il se pourrait que, pour la requête 3, Google fasse une recherche sans accepter les "heur" et "heurs" d'où un peu moins de résultats. Il se pourrait aussi que les filtres ne soient pas les mêmes avec et sans correction orthographique, ce qui amènerait donc des classements plus ou moins favorables, mais sans que ceci soit lié à la présence de la faute d'orthographe dans la page (+ les ancres). Jean-Luc -
France : Informatique et liberté : seulement pour les Français ?
Jeanluc a répondu à PGMC - Forum : Administration & Droit
Qu'est-ce qui vous pousse à penser que automne.ws soit une source d'informations juridiques de référence ? Jean-Luc -
Suggestion : Le résultat est étonnant. Jean-Luc
-
Bonjour, Le problème ne se pose qu'avec IE. Avec Opera ou Firefox, c'est ok. C'est bien ça ? Jean-Luc