|
Introduction de la connaissance a priori
en reconnaissance de formules mathématiques
Localisation :Irisa, Rennes
Equipe Imadoc (IMAges et DOCuments)
Responsable : Jean CAMILLERAPP,
Bertrand COüASNON
(tél. direct : 02 99 28 66 40, email : couasnon@irisa.fr)
Mot-clés : Reconnaissance de documents, analyse structurelle,
gestion des connaissances a priori, segmentation,
formules mathématiques.
Sujet : Dans le domaine de la reconnaissance de documents,
la reconnaissance de formules mathématiques a déjà fait l'objet
de nombreuses études. Cependant, selon la littérature, certaines
difficultés ne sont toujours pas résolues : caractères se touchant,
petits symboles...
Les résultats actuels sont insuffisants dans le cadre d'une utilisation
industrielle. Il est en effet nécessaire, d'une part d'obtenir de
meilleurs taux de reconnaissance, et d'autre part d'éviter une relecture
fastidieuse et coûteuse de l'ensemble des formules. L'objet de cette
thèse sera donc d'introduire la connaissance a priori
déduite des règles de constitution des formules afin d'améliorer
la segmentation (i.e. la reconnaissance) et de permettre
au système de détecter avec, une grande certitude, les zones susceptibles
d'être mal reconnues.
Ce travail sur l'introduction de la connaissance a priori
reprendra et étendra les méthodes développées au sein de l'équipe
Imadoc. Il sera nécessaire de définir une formalisation grammaticale
des formules mathématiques, ainsi que de déterminer les connaissances
sémantiques utiles à une meilleure reconnaissance. Il faudra également
définir une méthode de segmentation contextuelle des symboles mathématiques.
Cette méthode pourra utiliser un classifieur, développé dans l'équipe
Imadoc, capable de rejeter des formes qui ne correspondent pas à
des symboles.
Ce travail s'intègre dans la réalisation d'un système complet
et générique de reconnaissance de documents structurés pouvant s'adapter
à d'autres types de documents.
File translated from TEX
by TTH,
version 2.25.
On 8 Mar 2000, 15:33. |