davout Posté 14 Mars 2005 Posté 14 Mars 2005 Bonjour ! J'ai essayé de mettre en place un moteur PHPDig afin d'indexer le contenu d'un petit site web qui sert d'entrepôt et de gestionnaire pour des documents PDF (des articles scientifiques en l'occurence ). L'indexation du contenu HTML fonctionne plutôt bien mais par contre PHPDig n'indexe pas du tout le contenu des documents PDF. Pourtant j'ai bien mis l'option correspondante à true dans son fichier de config, l'utilitaire d'extraction du texte à partir des PDF fonctionne correctement quand il est lancé à la main... Quelqu'un a-t-il un idée, une expérience ou alors une proposition d'un autre moteur permettant d'indexer du contenu PDF ? Merci !
Anonymus Posté 14 Mars 2005 Posté 14 Mars 2005 1/ La décision de Charter, Admin du forum 'phpdig', de rendre ses réponses 'payantes' me chagrine. (désolé pour ceux qui n'ont pas suivi ) 2/ Tu trouveras probablement la réponse à ton problème dans ce post : http://www.phpdig.net/forum/showthread.php?t=570 qui explique le bug, puis sa correction, pour indexer des pdf, en passant par du html. Nico.
davout Posté 15 Mars 2005 Auteur Posté 15 Mars 2005 Merci! Ca ne marche pas, mon erreur doit-être ailleurs, par contre phpdig indexe correctement quand on lui donne directement l'URL du fichier PDF. Saloute !
burinho Posté 15 Mars 2005 Posté 15 Mars 2005 et oui après 4 jours, j'y suis arrivé, je crois que j'ai du compliquerle probleme avec les names de form, select des input etc... en tout cas j'aimerais remercier tout ceux qui m'ont aidé
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant