Stephane Posté 5 Octobre 2003 Posté 5 Octobre 2003 Juste un petit coup de gueule sur un problème qui m'agace particulièrement avec le "moteur numéro un". Manifestement, Google n'est pas capable d'indexer correctement les fichiers Flash. Il n'extrait que les liens pour les comptabiliser dans son calcul de Pagerank. Ce choix de n'indexer que partiellement les fichiers swf est déjà assez étonnant en soi, vu que les technos permettant d'extraire le texte des fichiers Flash sont libres de droit. Fast utilise cette méthode d'indexation par exemple. Je peux comprendre que Google ait fait ce choix par souci d'économie de ressources, mais dans ce cas pourquoi s'obstine-t-il à présenter des fichiers swf dans les résultats de recherche ? Il pourrait très bien n'utiliser les liens contenus dans les flash que pour son calcul de PR, sans chercher à les ajouter à son index. Je ne comprends pas la raison de ce choix, sauf à penser que Google cherche ainsi à gonfler artificiellement le volume de sa base... Mais le problème principal est ailleurs... Je constate que Google ne respecte pas le protocole d'exclusion par robots.txt dans le cas des fichiers .swf. Il nous interdit donc de lui interdire des fichiers qu'il n'est pas capable d'indexer correctement... Je trouve ça assez choquant. A quoi servent les standards tels que celui du robots.txt si le moteur numéro un se permet de ne pas les appliquer ? Actuellement, la seule méthode fiable pour empêcher Google d'indexer les swf est donc de barrer l'accès à Googlebot via le .htaccess, ce qui n'est quand même pas la méthode la plus simple, ni la plus conforme aux standards
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant