deuletor Posté 24 Février 2007 Posté 24 Février 2007 bonjour, voila j'ai un partenaire qui ecrit des news et permet sont utilisation par rss. donc rien d'illégal. j'aimerais les recupére pour les ajouter dans une base de donnée mais comment faire ? je commence un peu a me debrouiller en php mais je suis pas un pro donc si quelqu'un peu m'aide merci.
Loupilo Posté 24 Février 2007 Posté 24 Février 2007 Si tu touches un peu en PHP et que tu utilises la version 5, je te conseille simplement de lire la documentation du module SimpleXML. C'est de loin le moyen le plus simple et le plus puissant pour exploiter un flux RSS ! Si tu utilises PHP4, il te faudra trouver un parseur XML, mais je n'ai pas de nom en tête, il faudra chercher
loxi Posté 24 Février 2007 Posté 24 Février 2007 Salut, tu as magiepiee rss qui est assez performant. :-) Sinon comme on vient de te le proposer, si tu as accés à PHP5 : Simplexml:)
Harry_20 Posté 24 Février 2007 Posté 24 Février 2007 Moi j'utilise ATOM ... il est simple d'utilisation pour parser un flux RSS ou pour en créer un (deux classes en tout). Un autre avantage : il est adapté aux nouveaux standards
deuletor Posté 25 Février 2007 Auteur Posté 25 Février 2007 ha sa fait toujours plaisir de voir l'enthousiasme des personnes qui nous répondre sur ce forum !!! merci. Oui magpierss je connais vaguement mais pour vous quel est le meilleur agrégateur je cherche au plus simple . Je vois comment faire avec l'agrégateur je récupérais les news dans ma base en vérifiant une des entrées titre ou date si elle n'existe pas. Pour éviter une surcharge j'utiliserais les dates pour suprimer les dernier news . Et pour éviter trop de connections a ma base je lancerais mon script a heure fixe avec un crom. voila c'est une méthode un peu barbare et il doit avoir plus simple mais comme j'ai dit plus haut je suis pas un pro . si vous avez une autre solution .....
Sarc Posté 25 Février 2007 Posté 25 Février 2007 Bonjour, Pourquoi supprimer les News ? Même anciennes, elles peuvent être utiles pour 1. Le contenu et les visiteurs de ton site 2. Ton référencement => plus de pages, plus de contenu, plus de choses à se mettre sous la dent, plus de mots-clefs... Bref, ça serait tout bénef de les laisser ! Ca me dérange pas de garder quelques Mo de données dans ma base, moi tant que c'est du contenu utile... Mais tu n'es pas obligé de stocker les données en plus ? Le RSS sert justement à recevoir les données d'un autre site... Par exemple dans la partie actualité de mon site, j'ai directement les RSS provenant du Nouvel Obs, rien de stocké dans ma base...
Harry_20 Posté 25 Février 2007 Posté 25 Février 2007 Je réfléchis aussi de mon côté à la solution que je vais employer Disons qu'ici c'est un peu différent, j'analyse plusieurs flux RSS et j'extrais les news relatives à un domaine en particulier pour en afficher les plus pertinents. La procédure prend plus de temps surtout s'il y a plusieurs flux à analyser, si je veux classer par pertinence, supprimer les doublons, calculer l'indice de pertinence, ... J'hésite entre plusieurs solutions : - mettre un javascript qui permettrait l'affichage des news tout en permettant l'affichage de la page dans un premier temps ... ici l'opération serait recommencée à chaque accès de la page - effectuer les opérations de sélection dans une table "tampon" ou dans le script PHP et stocker le résultat dans la base de donnéesn, avec réactualisation régulière des informations P.S. Je n'ai pas eu de difficulté avec ATOM même si je ne suis pas trop familier du XML ou de l'intégration de scripts externes. J'ai essayé avec d'autres mais ça ne fonctionnait pas ou alors ils n'étaient pas à jour par rapport à la version des flux RSS.
Sarc Posté 25 Février 2007 Posté 25 Février 2007 Effectivement, si tu veux faire un tri plus précis parmi les infos RSS, tu peux penser à stocker dans une bdd... Même si je te conseille de ne pas supprimer après coup, ça rajoute du contenu sous forme d'"archives"... Par contre, difficile de trier en temps réel les derniers RSS parus, sans qu'il y ait une intervention manuelle. Les doublons sont pas forcément visibles par la technologie (deux articles sur un même thême X ne traitent pas forcément ce thème sous le même regard).
Harry_20 Posté 25 Février 2007 Posté 25 Février 2007 non sarc je suis d'accord avec toi pour le fait que le traitement manuel est supérieur à une opération automatique Cependant, je ne vais pas traiter l'info de manière exhaustive ... et je n'ai pas le temps de traiter plusieurs centaines d'extraits chaque jour non plus D'où mon idée. En ce qui concerne le stockage dans la base de données ... je me pose l'une ou l'autre question en rapport avec les droits d'auteur (suite à ce qui s'est passé avec Google). Je ne tiens pas à m'approprier le contenu des autres mais à présenter une rubrique qui peut être utile pour mes visiteurs, d'autant plus que les flux RSS présentent des contenus qui apparaissent et disparaissent très vite ! Je m'écarte un peu du sujet initial mais je pense que c'est une question importante aussi quand on se lance
deuletor Posté 25 Février 2007 Auteur Posté 25 Février 2007 (modifié) oui c'est vrai que je pourrais les garder et reprendre seulement le lien avec la date . c'est referencer le rss ? Mais me viens cet question Peut on reprendre des news d'un site pour d'ajouter dans une base sans demander l'autorisation car dans se cas la il serait facile de reprendre les plus grands hebdo de france et du monde et de se faire une mega-base . Pas mal ton site sarc c'est un peu dans cet état d'esprit que je cherche à faire. sarc comment tu fais pour l'enregistrement dans ta base tu utilise un crom ou c'est une vérification a chaque affichage de page ou autre ? Modifié 25 Février 2007 par deuletor
deuletor Posté 25 Février 2007 Auteur Posté 25 Février 2007 finalement non je pourrais pas faire comme j'ai dit garder seulement l'url du flux car je veux y rajouter un moteur de recherche a moin qu'il crawl mes page mais la encore si je recois 30 news par jour le moteur de recherche va pas suivre .
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant