yhugo Posté 28 Novembre 2006 Posté 28 Novembre 2006 Bonjour tous, Je recherche un script pour un moteur de recherche qui me permetterait de chercher dans un répertoire en particulier qui contient des PDF. C'est PDF sont des fiches techniques, et je veux permettre aux utilisateurs de chercher dans ces fiches rapidement. Voilà ... Merci et bonne journée y.
Tom_Pascal Posté 28 Novembre 2006 Posté 28 Novembre 2006 Bonjour, Une des solutions possibles à envisager serait de passer tous ces documents dans un filtre "PDF2HTML" comme il en existe sûrement de très bons... puis d'utiliser n'importe quel moteur/script de recherche capable d'indexer des documents HTML (donc surement à peu près tous )
yhugo Posté 28 Novembre 2006 Auteur Posté 28 Novembre 2006 (modifié) Bonjour, Une des solutions possibles à envisager serait de passer tous ces documents dans un filtre "PDF2HTML" comme il en existe sûrement de très bons... puis d'utiliser n'importe quel moteur/script de recherche capable d'indexer des documents HTML (donc surement à peu près tous ) Salut Tom_Pascal, Il y aura de nouveaux pdf chaque semaine importés (à l'aide d'un interface CMS) par les gens du bureau ici qui ne s'y connaissent pas trop en Web ... J'ai bien peur que cette opération serait un peu laborieuse pour eux. Merci Modifié 28 Novembre 2006 par yhugo
NorSeb Posté 28 Novembre 2006 Posté 28 Novembre 2006 Bonjour, Je crois que PhpDig peut indexer le contenu des documents PDF. A voir, je ne peux pas te poster 1 url dans l'immédiat désolé mais tu trouveras facilement ce moteur de recherche sur google.
Tom_Pascal Posté 28 Novembre 2006 Posté 28 Novembre 2006 (modifié) swish-e peut le faire également (cf http://swish-e.org/docs/swish-faq.html#can...d_documents_)... Mais en réalité, il me semble bien que le principe est d'utiliser une classe "Filter" qui va convertir AUTOMATIQUEMENT certains formats (PDF,DOC...) en HTML avant indexation... (les fichiers html sont "temporaires", juste créés au moment de l'indexation et détruits aussitot). Si yhugo souhaite utiliser un moteur qui ne reconnait pas "nativement" les PDFs, il doit pouvoir peut se fabriquer une sorte de "préfiltre" automatique basé sur le même principe. Modifié 28 Novembre 2006 par Tom_Pascal
yhugo Posté 28 Novembre 2006 Auteur Posté 28 Novembre 2006 Merci les gars Je vais faire le tour de vos suggestions et voir ce qu'il en retourne ... Merci et bonne journée
yhugo Posté 28 Novembre 2006 Auteur Posté 28 Novembre 2006 Bon j'ai installé phpDig sur mon serveur sans problème ... Mais je ne suis pas sûr de comprendre comment l'intégrer dans mon site ... avec ce que j'ai fait le navigateur ne me retourne qu'une page blanche ... :S Est-ce que quelqu'un est déjà passé par-là ? Merci
NorSeb Posté 29 Novembre 2006 Posté 29 Novembre 2006 Tu dois avoir une partie administration de PhpDig qui te permet de lancer l'indexation automatique du site.
yhugo Posté 29 Novembre 2006 Auteur Posté 29 Novembre 2006 Tu dois avoir une partie administration de PhpDig qui te permet de lancer l'indexation automatique du site. Oui j'ai utilisé l'admin et j'ai déjà indexé mes pages ... Ce que je n'arrive pas à faire c'est d'afficher le formulaire de recherche sur une page ... J'ai modifié un template et tout ce que je vois est une page blanche ... Leur forum est payant malheureusement. J'ai l'impression que c'est un truc de base que j'ai pas compris ... Merci
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant