Aller au contenu

Sujets conseillés

Posté

Bonjour à tous !

J'ai effectué il y a quelques temps une demande à Google actualités qui avait été accepté sur cette url : http://www.mjackson.fr/index.php?showforum=161

Ne voyant toujours aucune news reprise de mon site par google actu sur Michael, je les contacte et voici leur réponse:

Bonjour,

Merci de votre message. Après investigation, nous avons constaté que notre

système ne pouvait pas explorer vos articles car ils sont configurés comme

des messages ou des fils de forum de discussion.

Comme vous le savez peut-être, Google Actualités est compilé uniquement

par des algorithmes informatiques et les articles sont collectés à l'issue

d'une analyse automatique des sites Web d'information. Pour analyser

correctement les articles, les sources d'information exploitées par Google

Actualités doivent être configurées au format HTML standard.

Si vous pouvez apporter les modifications à votre site (ou à une section

de votre site présentant des articles d'information), nous serions heureux

de le réexaminer afin de l'intégrer. Vous trouverez ci-après quelques

conseils techniques qui aideront notre robot d'exploration à trouver et

indexer correctement les articles figurant sur votre site :

1. Pour que notre robot-explorateur extraie correctement les articles,

votre site doit être en HTML standard.

2. Chaque page contenant le texte complet d'un article doit posséder une

URL distincte qui demeure inchangée. Nous ne pouvons pas ajouter sur

Google Actualités de sites présentant plusieurs articles sur une même URL.

3. De plus, l'URL de chaque article doit contenir un numéro unique

comportant au moins trois chiffres.

Notre robot-explorateur ne pourrait pas, par exemple, analyser les URLs

suivantes :

www.google.fr/rongeurs_dans_la_brume.html

www.google.fr/infos/article23.html

En revanche, il pourra analyser les URLs suivantes :

www.google.fr/infos/08112003/article.html

www.google.fr/infos/rongeurs_dans_la_brume/23467.html

4. Notez également que nous ne pouvons pas ajouter de sites dont les URL

contiennent une date. Les URLs contenant des dates changent souvent tous

les jours ou toutes les semaines. Ces changements réguliers nous empêchent

de détecter les modifications apportées au contenu, car nous ne pouvons

pas déterminer l'URL la plus récente à analyser.

5. notre robot-explorateur est actuellement optimisé pour analyser les

liens HTML classiques. Nous ne pouvons pas explorer les liens graphiques

ni les liens intégrés dans des scripts Javascript.

Exemple de site que nous pouvons analyser : http://english.chosun.com.

Notez que tous les articles de ce site sont associés à des URLs distinctes

qui restent inchangées.

Nous apprécions votre aide dans le cadre de notre processus d'amélioration

de Google Actualités. N'hésitez pas à nous contacter si vous avez d'autres

questions.

Cordialement,

L'équipe Google

1/ Pourquoi avoir préalablement accepté mon lien puis ensuite me dire qu'il n'est pas valable?

2/ Un flux rss pourrait convenir? Si non, quelqu'un a une idée de ce que je dois faire?

Je vous remercie d'avance.

Posté

Bonjour,

Réponse à la question 1 : Certainement parce que c'est un robot qui t'a répondu.

Réponse à la question 2 : Si tu avais lu les notes à l'attention des éditeurs tu aurais avant même de soumettre, lu tout ce que Google t'a répondu. Et en autre la réponse à ta question pour les flux RSS :

Google Actualités recueille les articles en explorant d'autres sites d'information. Veuillez noter que nous ne sommes pas en mesure d'accepter des articles qui nous sont envoyés par courrier électronique ni d'explorer les flux RSS ou Atom

Source : Règles pour les éditeurs

Posté

Je sais bien Arlette, mais j'ai bien précisé qu'ils avaient au préalable accepter le lien tel quel....

D'où mon incompréhension....

Posté
Je sais bien Arlette, mais j'ai bien précisé qu'ils avaient au préalable accepter le lien tel quel....

Oui, mais c'est ce que je t'ai donc répondu à ta question 1 : C'est un robot qui t'a répondu. Donc on accepte tout, partant du principe que tu soumets après avoir lu les règles à l'attention des éditeurs... Et après le robot ne peut pas aller plus loin. Et quand tu demandes le pourquoi du comment on te répond ce qui est inscrit dans les règles. CQFD.

Visiblement tu ne les avais pas lu, puisque tu demandes pour les flux RSS alors que c'est bien stipulé ;)

Posté

Autrement dit, ils acceptent ton site, mais se réservent le droit de l'afficher.

et en l'occurence, ils ne l'affichent pas :)

[après visite sur ton site]

De plus, dans les urls de ton forum, tu as les id de session :

s=b01ead182b9beff5799bfb053c37e34b&showtopic=10105

Une actualité se présente sous plusieurs urls, et c'est spécifié dans le point 2 mentionné dans leur mail : un article <> une url.

pour ton site, ce n'est pas le cas.

Posté

Merci pour vos réponses. Pouvez-vous me donner une technique, que vous voyez la plus simple, pour automatiser ces news au format HTML?

Merci

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...