Towards End-to-end Handwritten Document Recognition

Séminaire
Date de début
Date de fin
Lieu
IRISA Rennes
Salle
Salle Aurigny
Orateur
Denis Coquenet, CNAM Paris
Département principal

La tâche de reconnaissance d’écriture manuscrite a longuement été étudiée ces dernières décennies pour ses nombreuses applications. Actuellement, la grande majorité des approches à l’état de l’art repose sur un paradigme séquentiel en trois étapes: un document est segmenté en lignes de texte, qui sont ensuites ordonnées et reconnues. Dans cette présentation, nous mettrons en évidence les inconvénients d’un tel paradigme séquentiel, que l’unité de segmentation utilisée soit la ligne ou bien le paragraphe. Nous étudierons alors notre proposition d’un paradigme unifié pour cette tâche. Celui-ci mêle à la fois analyse et reconnaissance de documents entiers au sein d’un seul et même traitement, réduisant ainsi la quantité nécessaire d’annotations tout en obtenant des résultats à l’état de l’art sur différents jeux de données de référence.

 

Séminaire organisé par l'équipe Intuidoc