Aller au contenu

Jeanluc

Membre+
  • Compteur de contenus

    2 003
  • Inscrit(e) le

  • Dernière visite

Tout ce qui a été posté par Jeanluc

  1. Bonjour papanoël, C'est aussi ce que je croyais, mais, suite à la réponse de Dan, j'ai fait différents tests et je suis tombé sur site:www.chinaclub.cc. Il s'agit bien d'un .cc dans les Pages: France. Reste à déterminer plus précisément dans quels cas ça marche et dans quels cas ça ne marche pas... Jean-Luc
  2. Un préjudice est un tort, un dommage (dixit Larousse). A moins que la photo ait été accompagnée de commentaires particuliers, je ne vois pas quel "dommage commercial" a subi le propriétaire de la photo. Si "préjudice commercial" il y a, c'est au propriétaire de la photo à en prouver l'existence. Un "préjudice commercial" pourrait, par exemple, être une perte de revenu sur les droits de la photo. Est-il raisonnable de penser qu'ils ont perdu un ou plusieurs clients pour la photo suite à sa publication sur ton site ? Et toi, aurais-tu jamais envisagé de publier cette photo si tu avais su qu'elle leur appartenait et que sa publication n'était pas libre ? Si la réponse à toutes ces questions est non, il me semble qu'il n'y a aucun "préjudice commercial" réel. Ce n'est pas parce qu'il y a eu infraction qu'il y a eu préjudice. C'est probablement inexact. De nos jours, toute personne est supposée capable d'envoyer un email à un webmaster. Si la cliente de l'avocat t'avait envoyé un email signalant le problème, je suppose que tu aurais enlevé la photo sans faire d'histoire. Si elle a engagé des frais inutiles, c'est son problème. Toujours d'après mon Larousse, une extorsion est une "action pour obtenir par force, violence ou menace". Je ne ferai pas plus de commentaire sur ce point précis. Evidemment, malgré tout, cette affaire reste délicate et tu aurais intérêt à te faire conseiller par un professionnel du droit. Si tu ne connais pas d'avocat, il existe probablement des associations qui pourraient te fournir l'aide juridique de base gratuitement ou moyennant une participation symbolique. Jean-Luc
  3. Effectivement, je viens de trouver un .cc dans les Pages: France. Merci Dan. Jean-Luc
  4. Bonjour, Pour ton .cc hébergé en France : Aucune chance d'apparaître dans Pages: France. Pour les recherches Web et Pages francophones, selon que tu fais une recherche avec google.fr, google.be, google.ca,..., tu es modérément favorisé si tu es dans le pays en question. Je pense que ça peut être facilement compensé si tes liens viennent principalement de ce pays. Jean-Luc
  5. Prudence! Conditions générales standard de Google AdSenseTM en ligne, paragraphe 2, fin de l'alinea "Parrainages" : Une autorisation expresse de Google est indispensable pour toute incitation. Je sais qu'on ne le dirait pas à voir les dizaines de pages nouvellement créées pour expliquer les bienfaits de AdSense et de Firefox... Jean-Luc
  6. Dans les pays démocratiques comme les nôtres, il ne faut aucune autorisation pour parler de quelqu'un ou de quelque chose (tant qu'on reste dans certaines limites qui devraient être évidentes pour tout le monde). Jean-Luc
  7. C'est la bonne définition. Si un lien vers la même adresse est trouvé ailleurs, la page en question sera quand même indexée, mais elle ne bénéficiera pas du "poids" (= PR) du lien avec le "nofollow". Jean-Luc
  8. Bonjour, Google pense que tu lui envoies des requêtes automatisées, comme le font certains logiciels de recherche du positionnement sur les mots clés. Google bloque les requêtes automatisées qu'il croit détecter. Il suffit de patienter un peu sans faire de requête automatisée et puis ça remarche. Jean-Luc
  9. Bonjour, Le fichier robots.txt est fait pour ça. Tu y mets quelque chose du genre User-agent: * Disallow: /galerie.php?idcat= De cette façon, il n'ira plus visiter les pages dont l'adresse commence par /galerie.php?idcat=. Jean-Luc
  10. [i]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/recherche/ est le lien à travers le texte Recherche livres anciens dans la page [i]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/. [i]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/recherche/ est le lien à travers le texte Recherche livres anciens dans la page [i]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/. [i]http://www.bouquinique.com/livres-titres.php/recherche/'>]http://www.bouquinique.com/livres-titres.php/recherche/ est le lien à travers le texte Recherche livres anciens dans la page [i]http://www.bouquinique.com/livres-titres.php/. Si cela ne te semble pas clair, va sur la page [i]http://www.bouquinique.com/livres-titres.php/ et clique 10 fois sur le lien Recherche livres anciens, puis regarde l'adresse dans la barre d'adresse. Le site gimp.org ne traite pas correctement les erreurs 404. C'est un exemple de ce qu'il ne faut pas faire. Concernant ton .htaccess, je pense qu'il devrait être écrit autrement, mais je préfèrerais laisser la parole à un grand expert du sujet comme Dan. Jean-Luc
  11. Faut être certain de renvoyer un code 404 (parfois on renvoie des 302 sans s'en rendre compte). Ou, encore mieux, tu renvoies un code 301 et tu rediriges vers la bonne adresse. C'est le top. Jean-Luc
  12. Tu devrais relire la remarque très judicieuse de Cendrillon, un peu plus haut... Jean-Luc
  13. Bonjour, Tu parles d'un filtre de courrier sortant au niveau de ton serveur ou d'un filtre sur ton service de messagerie (côté client) ? Jean-Luc
  14. Bonjour, Tu as le même problème que fedorax. Il ne faut pas trop vite accuser ce pôvre Google... ;o) Son collègue Yahoo a aussi trouvé tes /catalogue-catalogue-... : link:http://www.alfos-peche.com/catalogue-catalogue-daiwa-7.html. Tu vas dans le code source des deux pages indiquées et tu trouves les liens vers /catalogue-catalogue-.... Ce n'est pas une bonne technique de ne pas renvoyer de code 404 pour les adresses incorrectes. Google n'a jamais dit qu'il prendrait le sitemap comme une Bible. C'est juste une source d'informations parmi d'autres. Jean-Luc
  15. Bonjour, Le problème principal est que, pour ces adresses fantaisistes, ton site renvoie un code 200 OK au lieu d'un code 404. Si je visite [i]http://www.bouquinique.com/livres-titres.php/recherche/recherche/, j'y trouve un lien Recherche livres anciens vers [i]http://www.bouquinique.com/livres-titres.php/recherche/recherche/recherche/. Et si je visite cette dernière page, ... Résultat : des centaines de pages bidon en duplicate content. Jean-Luc
  16. Si tu penses que l'indexation du contenu de ces pages peut nuire au référencement des autres, tu les places dans un répertoire exclu par robots.txt. Tu évites en même temps un gaspillage de bande passante. Je n'imagine pas que l'emploi de robots.txt puisse dévaloriser le site aux yeux de Google. A mon avis, que ces pages (exclues par robots.txt) apparaissent dans des résultats de Google sans description ni cache ne donne pas une mauvaise image aux visiteurs. Au pire, le visiteur ne remarque pas la page. Peut-être peut on prévoir un moyen simple de passer de ces pages à la page d'accueil du site pour récupérer un maximum de visiteurs. Jean-Luc
  17. Bonjour Anonymus, D'accord, mais il peut en noter l'adresse dans sa database et ne jamais l'afficher. Le problème est que le Protocole d'Exclusion des Robots ne définit pas ce qu'il faut entendre par le mot indexer. On peut le comprendre comme toi ou on peut comprendre "ne jamais afficher cette adresse dans les résultats". J'ai fait des tests pour comparer comment Googlebot, Slurp et MSNBot interprétaient ce noindex. D'après mes tests, MSNBot n'indexe pas le contenu de la page mais conserve l'adresse et Googlebot et Slurp excluent complètement l'adresse des résultats de recherche. Remi a mis le doigt sur le fait que, pour Googlebot, ce n'était pas aussi simple. Pour Google, je pense que le formulaire de suppression de pages permet de supprimer complètement les adresses désignées dans les résultats de recherche. Ce n'est pas pour cela que le rel=nofollow a été créé et, comme tu le dis dans ton dernier message, on ne contrôle pas ce que font les autres webmasters.. C'est aussi mon avis pour mes sites, mais il y a d'autres points de vue. Pour le référencement, cela ne présente aucun intérêt de faire disparaître des adresses de pages des résultats de recherche. Mais certains peuvent, pour certaines pages, avoir un souci de discrétion. Il existe des techniques pour limiter l'accès au contenu des pages, mais on se dit aussi parfois que si les hackers ignorent l'existence d'un répertoire, il est encore mieux protégé. Jean-Luc
  18. Ok, c'était un malentendu. J'ai trouvé les pages dont tu parlais. Je vais ré-examiner cela en détail, parce que j'arrive même à les faire apparaître sans la commande site:. Exemple : cru-barrejats "Basse qualité" frondaison. Jean-Luc
  19. Je sais, je suis comme ça... Je ne vois rien de spécial. Peut-être que j'aboutis sur un autre data center que toi. Je ne comprends pas pourquoi je dois regarder les "pages similaires". A part la première, ce sont toutes des pages d'autres sites. Merci pour tes infos. Jean-Luc P.S. très très beau site. Bravo.
  20. Ce que tu expliques est parfaitement logique et conforme au standard. Si robots.txt interdit l'accès à une page, Googlebot s'interdit de venir lire la page, il ne peut donc pas savoir qu'elle contient le "noindex" et que tu ne veux pas qu'elle apparaisse dans son index. Comme tu n'es certainement pas le seul à te poser cette question, je viens d'ajouter une page à la FAQ : Puis-je utiliser robots.txt et la balise META "robots" sur un même site ?. Jean-Luc
  21. Bonjour et bienvenue sur le hub, Si tu peux rendre une page de ton intranet accessible depuis l'extérieur, tu pourrais en vérifier les en-têtes HTTP au moyen de l'outil du hub. Cela te permettrait de t'assurer que ton serveur réagit bien comme tu l'espères ou de constater qu'il envoie un text/html; charset=utf-8. Jean-Luc
  22. Régis : merci. Remi : merci aussi. Il me semble qu'une page avec la META "noindex" n'apparaît pas dans les résultats de la commande site: de Google. Pour être certain, je vais refaire un test spécifique avec site: et je communiquerai le résultat. Si tu as des exemples visibles sur Google, ça m'intéresse. Jean-Luc
  23. Bonjour, D'accord avec Americas. A part la vitesse d'affichage des pages, je ne vois pas ce qui pourrait expliquer l'augmentation du revenu. Jean-Luc
  24. Bonjour, J'ai mis en ligne une série de pages sur le Protocole d'Exclusion des Robots, c'est-à-dire sur le rôle et le contenu du fichier robots.txt et de la balise META "robots". J'ai essayé d'être complet. Rien de nouveau en soi, puisque tout cela a été défini en 1994,... bien avant l'apparition des puissants moteurs de recherche actuels. En fait, c'est justement cette ancienneté de la norme qui cause des malentendus dans son utilisation. J'ai essayé de préciser, dans les détails, la syntaxe et les effets exacts de l'emploi de robots.txt et de META "robots" et les variantes propres à Googlebot, MSNBot et Yahoo! Slurp, pour que même les experts y trouvent des informations utiles, par exemple : - quand et comment employer le caractère "*" dans robots.txt ? - comment éliminer toute référence à une page dans les résultats de recherche ? Jean-Luc
  25. Tu n'es pas prévenue de l'existence d'annonces au CPM sur ton site. Si tu utilises des critères AdSense assez pointus, tu constateras parfois que tu as des revenus sans clic, donc des annonces au CPM. Jean-Luc
×
×
  • Créer...