Le 11 Sep 2008 22:21:47 GMT, Christophe Raverdy
<craverdy@ailleurs.invalid> écrivait dans fr.comp.lang.php:
Bonjour.
Je programme en ce moment un utilitaire me permettant de gérer une base
documentaire à partir d'expressions régulières.
Je n'ai aucun problème pour les expressions régulières par contre la base
documentaire est problématique en ce que l'essentiel des fichiers est au
format word.
Je voudrais donc pouvoir récupérer le document (je sais faire) et le
transmettre par exemple à une API d'openffice afin de convertir le document
word en texte brut. Bien entendu s'il existe s'il existe une méthode plus
efficace je suis preneur.
J'aurais donc aimé connaître les prérequis (principalement sous windows),
les API et leur mode d'emploi.
Par avance, merci.
Le moteur de Google (et d'autres aussi) indexe les fichiers .doc. Il
se trouve que Google vend cette technologie pour utilisation sur un
PC. Comme le PHP offre la fonction "system", ce serait peut-être une
façon de s'en sortir si le but est seulement de retrouver des
informations dans des fichiers .doc et non de les convertir. Bon, les
expressions régulières de Google ne sont pas très poussées mais il y a
peut-être moyen de faire une conversion. En tous cas, c'est une piste
à explorer à mon avis.
Denis