Towards End-to-end Handwritten Document Recognition

Seminar
Starting on
Ending on
Location
IRISA Rennes
Room
Salle Aurigny
Speaker
Denis Coquenet, CNAM Paris

La tâche de reconnaissance d’écriture manuscrite a longuement été étudiée ces dernières décennies pour ses nombreuses applications. Actuellement, la grande majorité des approches à l’état de l’art repose sur un paradigme séquentiel en trois étapes: un document est segmenté en lignes de texte, qui sont ensuites ordonnées et reconnues. Dans cette présentation, nous mettrons en évidence les inconvénients d’un tel paradigme séquentiel, que l’unité de segmentation utilisée soit la ligne ou bien le paragraphe. Nous étudierons alors notre proposition d’un paradigme unifié pour cette tâche. Celui-ci mêle à la fois analyse et reconnaissance de documents entiers au sein d’un seul et même traitement, réduisant ainsi la quantité nécessaire d’annotations tout en obtenant des résultats à l’état de l’art sur différents jeux de données de référence.

 

Séminaire organisé par l'équipe Intuidoc