IRISA

Séminaire

Vendredi 16 mai 1997 - 14h00
Salle de conférences Michel Métivier

Jean-Pierre BALPE
Groupe Paragraphe
(université de Paris 8)

La génération automatique de littérature

« ROMANS (Roman) », « Proverbes à ma façon », « Trois Mythologies et un poète aveugle », « Hommage à Jean Tardieu » autant de programmes de génération automatique littéraire réalisé à partir d'un même progiciel. Pour l'essentiel, ce progiciel repose sur une organisation complexe des données mêlant approche sémantique, syntaxique et rhétorique.

A l'intérieur de chaque groupe, les données ont la forme de structures récursives dont chacune d'entre elle peut contenir d'autres données encore, et ainsi de suite. Chaque donnée fonctionne comme un objet qui peut être interprété par une « grammaire sémantique ». C'est-à-dire, une grammaire où informations sémantiques et syntaxiques sont coprésentes et peuvent être exploitées de manière collaborative par un unique moteur de génération.

A partir d'un ensemble de règles diverses, ce moteur définit un chemin parmi les données disponibles. Comme certaines de ces règles utilisent localement des procédures aléatoires, il est impossible de prévoir quel peut être le texte résultant : chaque donnée porte tellement d'informations, et contient tellement d'autres données que la sélection de n'importe laquelle d'entre elles présente une probabilité très faible de produire deux résultats identiques. Bien plus, certains programmes littéraires ont la possibilité d'envoyer des informations à d'autres programmes du même type, donc à enrichir de façon dynamique leurs données. Chaque page est ainsi une nouvelle page et l'outil de génération propose une littérature infinie.