Aller au contenu

Créer un moteur recherchant des infos distantes ?


nza2k

Sujets conseillés

Bonjour tout le monde,

Il y a un an environ, j'ai commencé à bricoler php/mysql dans mon garage... Et là, y a un point sur lequel je bloque vraiment... J'ai beau avoir cherché, je n'ai pas trouvé de méthode simple et accessible expliquant comment faire ce que je veux...

Voici ce que je cherche à faire :

J'aimerais crée un moteur de recherche interrogeant des bases existant sous formes de fichiers xml, txt , ou csv accessibles via une url donnée (urls de mon serveur ou de serveurs distants).

Pour pouvoir paramétrer à volonté ce moteur, je pense créer des tables MySQL alimentées et mises à jour automatiquement par les fichiers cités ci-dessus (il y a peut-être d'autres solutions, notamment pour interroger des fichiers xml ?).

J'aimerais donc savoir où trouver des tutoriels accessibles expliquant comment programmer des scripts qui feront automatiquement ce travail d'insertion et d'update de données (toutes les nuits par exemple).

Savez-vous où je pourrai trouver ce type de tutoriels ?

J'ai trouvé un sujet sur ce forum parlant de requêtes quotidiennes automatisées

via des "crons"... Je n'ai jamais programmé de cron, mais je pense que ce n'est pas autorisé en hébergement mutualisé chez Sivit (ce qui est mon cas)... S'il est nécessaire de passer par un cron, connaissez-vous un webcron fiable et pas cher (voire gratuit !).

Merci pour votre aide.

Lien vers le commentaire
Partager sur d’autres sites

Lancer un moteur de recherche sur un hébergement mutualisé est complètement irréaliste.

De plus, vu la limitation en requêtes assez stricte chez Sivit, vous risquez de vous faire fermer le compte en moins de temps qu'il ne vous faudra pour arriver à crawler quoi que ce soit d'utile.

Dan

Lien vers le commentaire
Partager sur d’autres sites

Merci pour cette réponse Dan,

Attention, je ne compte pas créer un moteur type Google.

Non, il s'agit de créer un moteur interrogeant des données contenues dans quelques fichiers qui doivent peser au total quelques Mo... Quelques dizaines de Mo au plus...

Suis-je toujours dans l'irréalisme ?

Lien vers le commentaire
Partager sur d’autres sites

Non, c'est déjà bien plus réaliste. :)

Un des moteurs les plus utilisés est Aspseek, mais ses développements et mises à jour sont au point mort depuis belle lurette.

Il y a aussi des dérivés de celui-ci: mnoGoSearch par exemple.

Ces deux moteurs requièrent pour leur mise en place un accès au compilateur C++, ce qui n'est pas possible sur des hébergements mutualisés. Je ne sais pas s'il existe des packages pré-compilés, mais c'est possible.

Sinon, il te reste PhpDig ... écrit totalement en Php.

Dan

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...