POST A LIRE EN FONTE DE CHASSE FIXE
Sara Amadori nous disait :
Bonjour,
je suis une doctorante de l'université de Bologne.
Je ne suis pas un informaticien, donc il n'est pas facile pour moi de
rechercher et comprendre ce qui est disponible sur le web. J'aurais
besoin d'un logiciel open source pour compter les syllabes des mots
français. Ce logiciel devrait ensuite etre développé pour une analyse
automatique des vers d'un corpus électronique de textes.
Est-ce quelqu'un peut me dire où trouver ce compteur de syllabes
françaises?
Merci beaucoup,
Sara Amadori
---
Comme j'ai été un peu bref dans ma réponse par courriel, voici plus de
détails sur la manière dont je m'y prends. Je rappelle que mon idée est
de décompter les alternances (consonnes+voyelles), ce qui ne restitue pas
les endroits exacts où l'on change de syllabe, mais conserve le bon nombre
de syllabes.
Prenons un exemple :
« J'ai plus de souvenirs que si j'avais mille ans. » (Baudelaire)
On «avale», de gauche à droite, des groupes donnés par l'expression
régulière $consonnes$voyelles, où $consonnes est l'expression régulière
[bcdfghjklmnp(q|qu)rstvwxyz'-\s,.:!?;]* et $voyelles l'expression régulière
(a|à|â|e|é|è|ai|ay|i|î|...) etc, recensant les bonnes voyelles.
Des groupes tels que (e a) doivent être comptés aussi comme une voyelle.
Il faut traiter l'espace comme une consonne, ainsi que les ponctuations.
Ceci n'est qu'une première phase du traitement.
J'/ai// pl/u//s d/e// s/ou//v/e//n/i//rs qu/e// s/i// j'/a//v/ai//s
m/i//ll/e a//ns.
soit :
1 // 2 // 3 // 4 // 5 // 6 // 7 // 8 // 9 // 10 // 11
// 12 // et le dernier ne compte pas.
Le dernier ne compte pas car il est incomplet, et de toute manière il faut
adapter l'algorithme dans le cas de la dernière alternance, car ce peut
être une syllabe atone.
Noter que l'algorithme détermine le nombre de pieds d'un vers sans passer
par la décomposition du vers en mots puis le calcul du nombre de pieds de
chaque mot. C'est un algorithme « holistique ».
--esc