michaeljack Posté 15 Mai 2007 Posté 15 Mai 2007 Bonjour à tous ! J'ai effectué il y a quelques temps une demande à Google actualités qui avait été accepté sur cette url : http://www.mjackson.fr/index.php?showforum=161 Ne voyant toujours aucune news reprise de mon site par google actu sur Michael, je les contacte et voici leur réponse: Bonjour, Merci de votre message. Après investigation, nous avons constaté que notre système ne pouvait pas explorer vos articles car ils sont configurés comme des messages ou des fils de forum de discussion. Comme vous le savez peut-être, Google Actualités est compilé uniquement par des algorithmes informatiques et les articles sont collectés à l'issue d'une analyse automatique des sites Web d'information. Pour analyser correctement les articles, les sources d'information exploitées par Google Actualités doivent être configurées au format HTML standard. Si vous pouvez apporter les modifications à votre site (ou à une section de votre site présentant des articles d'information), nous serions heureux de le réexaminer afin de l'intégrer. Vous trouverez ci-après quelques conseils techniques qui aideront notre robot d'exploration à trouver et indexer correctement les articles figurant sur votre site : 1. Pour que notre robot-explorateur extraie correctement les articles, votre site doit être en HTML standard. 2. Chaque page contenant le texte complet d'un article doit posséder une URL distincte qui demeure inchangée. Nous ne pouvons pas ajouter sur Google Actualités de sites présentant plusieurs articles sur une même URL. 3. De plus, l'URL de chaque article doit contenir un numéro unique comportant au moins trois chiffres. Notre robot-explorateur ne pourrait pas, par exemple, analyser les URLs suivantes : www.google.fr/rongeurs_dans_la_brume.html www.google.fr/infos/article23.html En revanche, il pourra analyser les URLs suivantes : www.google.fr/infos/08112003/article.html www.google.fr/infos/rongeurs_dans_la_brume/23467.html 4. Notez également que nous ne pouvons pas ajouter de sites dont les URL contiennent une date. Les URLs contenant des dates changent souvent tous les jours ou toutes les semaines. Ces changements réguliers nous empêchent de détecter les modifications apportées au contenu, car nous ne pouvons pas déterminer l'URL la plus récente à analyser. 5. notre robot-explorateur est actuellement optimisé pour analyser les liens HTML classiques. Nous ne pouvons pas explorer les liens graphiques ni les liens intégrés dans des scripts Javascript. Exemple de site que nous pouvons analyser : http://english.chosun.com. Notez que tous les articles de ce site sont associés à des URLs distinctes qui restent inchangées. Nous apprécions votre aide dans le cadre de notre processus d'amélioration de Google Actualités. N'hésitez pas à nous contacter si vous avez d'autres questions. Cordialement, L'équipe Google 1/ Pourquoi avoir préalablement accepté mon lien puis ensuite me dire qu'il n'est pas valable? 2/ Un flux rss pourrait convenir? Si non, quelqu'un a une idée de ce que je dois faire? Je vous remercie d'avance.
Arlette Posté 15 Mai 2007 Posté 15 Mai 2007 Bonjour, Réponse à la question 1 : Certainement parce que c'est un robot qui t'a répondu. Réponse à la question 2 : Si tu avais lu les notes à l'attention des éditeurs tu aurais avant même de soumettre, lu tout ce que Google t'a répondu. Et en autre la réponse à ta question pour les flux RSS : Google Actualités recueille les articles en explorant d'autres sites d'information. Veuillez noter que nous ne sommes pas en mesure d'accepter des articles qui nous sont envoyés par courrier électronique ni d'explorer les flux RSS ou Atom Source : Règles pour les éditeurs
michaeljack Posté 15 Mai 2007 Auteur Posté 15 Mai 2007 Je sais bien Arlette, mais j'ai bien précisé qu'ils avaient au préalable accepter le lien tel quel.... D'où mon incompréhension....
Arlette Posté 15 Mai 2007 Posté 15 Mai 2007 Je sais bien Arlette, mais j'ai bien précisé qu'ils avaient au préalable accepter le lien tel quel.... Oui, mais c'est ce que je t'ai donc répondu à ta question 1 : C'est un robot qui t'a répondu. Donc on accepte tout, partant du principe que tu soumets après avoir lu les règles à l'attention des éditeurs... Et après le robot ne peut pas aller plus loin. Et quand tu demandes le pourquoi du comment on te répond ce qui est inscrit dans les règles. CQFD. Visiblement tu ne les avais pas lu, puisque tu demandes pour les flux RSS alors que c'est bien stipulé
Anonymus Posté 15 Mai 2007 Posté 15 Mai 2007 Autrement dit, ils acceptent ton site, mais se réservent le droit de l'afficher. et en l'occurence, ils ne l'affichent pas [après visite sur ton site] De plus, dans les urls de ton forum, tu as les id de session : s=b01ead182b9beff5799bfb053c37e34b&showtopic=10105 Une actualité se présente sous plusieurs urls, et c'est spécifié dans le point 2 mentionné dans leur mail : un article <> une url. pour ton site, ce n'est pas le cas.
michaeljack Posté 16 Mai 2007 Auteur Posté 16 Mai 2007 Merci pour vos réponses. Pouvez-vous me donner une technique, que vous voyez la plus simple, pour automatiser ces news au format HTML? Merci
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant