|
Apprentissage des grammaires catégorielles
Localisation :Irisa, Rennes
Responsables :
Mot-clés : Apprentissage; Langages Formels; Traitement
Automatique des Langues; Logique.
Sujet :
Un algorithme d'inférence grammaticale à partir d'exemples positifs
est un algorithme qui, étant donnés une classe de grammaires et
un nombre fini d'énoncés (éventuellement structurés), produit une
grammaire de la classe qui soit la plus générale possible à accepter
ces énoncés. La classe de grammaires considérée est intéressante
si elle est vaste mais autorise des algorithmes efficaces qui peuvent
atteindre tout langage de la classe dès qu'ils disposent de suffisamment
d'énoncés. Parmi de nombreuses applications (notamment, étude des
génomes), on s'intéresse à la linguistique informatique: engendrer
une grammaire à partir d'un corpus est non seulement un module utile
de traitement automatique des langues, mais aussi un test pour la
plausibilité cognitive des théories et formalismes linguistiques.
Les grammaires catégorielles [1,2] sont un formalisme logique
qui décrit les langages algébriques. Cette classe de grammaires,
trop vaste pour être apprenable, admet néanmoins une sous-classe
dite AB-rigide qui l'est et contient des langages algébriques. [1]
Il s'agit de proposer, de programmer et d'étudier des algorithmes
d'apprentissage pour des classes plus riches [2]: grammaires de
Lambek, grammaires en réseaux, grammaires multimodales,... Les grammaires
catégorielles ayant une interface aisée avec la sémantique de Montague,
les algorithmes d'apprentissage pourront utiliser la sémantique
des énoncés.
[1] M. Kanazawa, Learnable classes of categorial
grammars , CSLI, Cambridge University Press, 1998.
[2] van Benthem and ter Meulen (eds), Handbook of Logic and
Language. Elsevier, 1997. Chapitre 12 et 2.
File translated from TEX
by TTH,
version 2.25.
On 8 Mar 2000, 15:33. |