Denis Béchet and Annie Foret.
Incremental learning of iterated dependencies.
Journal of Machine Learning,
2022.
[doi:10.1007/s10994-021-05947-2]
Keyword(s): Grammatical inference - Categorial grammar - Dependency grammar - Incremental learning - Iterated types - Treebanks.
Abstract:
We study some learnability problems in the family of Categorial Dependency Grammars (CDG), a class of categorial grammars defining dependency structures. CDG is a formal system, where types are attached to words, combining the classical categorial grammars' elimination rules with valency pairing rules defining non-projective (discontinuous) dependencies; very importantly, the elimination rules are naturally extended to the so called "iterated dependencies" expressed by a specific type constructor and related elimination rules. This paper first reviews key points on negative results: even the rigid (one type per word) CDG cannot be learned neither from function/argument structures, nor even from dependency structures themselves. Such negative results prove the impossibility to define a learning algorithm for these grammar classes. Nevertheless, we show that the CDG satisfying reasonable and linguistically valid conditions on the iterated dependencies are incrementally learnable in the limit from dependency structures. We provide algorithms and also discuss these aspects for recent variants of the formalism that allow the inference of CDG from linguistic treebanks. |
@article{foret:ML2021,
author = {Denis B\'echet and Annie Foret},
title = {Incremental learning of iterated dependencies},
journal = {Journal of Machine Learning},
year = {2022},
volume = {},
number = {},
doi = {10.1007/s10994-021-05947-2},
url = {},
keywords = {Grammatical inference - Categorial grammar - Dependency grammar - Incremental learning - Iterated types - Treebanks},
abstract = {We study some learnability problems in the family of Categorial Dependency Grammars (CDG), a class of categorial grammars defining dependency structures. CDG is a formal system, where types are attached to words, combining the classical categorial grammars' elimination rules with valency pairing rules defining non-projective (discontinuous) dependencies; very importantly, the elimination rules are naturally extended to the so called "iterated dependencies" expressed by a specific type constructor and related elimination rules. This paper first reviews key points on negative results: even the rigid (one type per word) CDG cannot be learned neither from function/argument structures, nor even from dependency structures themselves. Such negative results prove the impossibility to define a learning algorithm for these grammar classes. Nevertheless, we show that the CDG satisfying reasonable and linguistically valid conditions on the iterated dependencies are incrementally learnable in the limit from dependency structures. We provide algorithms and also discuss these aspects for recent variants of the formalism that allow the inference of CDG from linguistic treebanks.},
}
Mireille Ducassé.
Kartu-Verbs : un système d'informations logiques de formes verbales fléchies pour contourner les problèmes de lemmatisation des verbes géorgiens.
Revue des Nouvelles Technologies de l'Information,
Extraction et Gestion des Connaissances, RNTI-E-38:421-428,
2022.
Note: Démonstration.
[WWW]
Abstract:
La langue géorgienne possède un système verbal complexe, à la fois agglutinant et flexionnel, avec de nombreusesirrégularités. Les formes fléchies d'un verbe peuvent être très différentes les unes des autres. Il faut une bonne connaissance de la grammaire géorgienne pour remonter à l'infinitif (le lemme d'accès des dictionnaires le plus fréquent). L'accès aux dictionnaires pour les débutants est, de ce fait, très difficile. De plus, il n'y a pas de consensus parmi les lexicographes du Géorgien sur les lemmes qui représentent un verbe dans les dictionnaires,ce qui complexifie encore davantage les accès.Nous proposons Kartu-Verbs, une base de formes fléchies de verbes géorgiens accessible par un système d'informations logiques. Cette démonstration montre comment, à partir de n'importe quelle forme fléchie, on peut trouver le lemme pertinent pour accéder à n'importe quel dictionnaire. Kartu-Verbs peut, ainsi,être utilisé comme une interface aux dictionnaires géorgiens. |
@article{ducasse2022,
author = {Mireille Ducassé},
title = {Kartu-Verbs : un système d'informations logiques de formes verbales fléchies pour contourner les problèmes de lemmatisation des verbes géorgiens},
journal = {Revue des Nouvelles Technologies de l'Information},
volume = {Extraction et Gestion des Connaissances, RNTI-E-38},
Editor= {Sihem Amer-Yahia and Arnaud Soulet},
year = {2022},
pages = {421-428},
Note={Démonstration},
HAL_ID = {hal-03542560},
Url={ https://editions-rnti.fr/?inprocid=1002755},
Abstract={La langue géorgienne possède un système verbal complexe, à la fois agglutinant et flexionnel, avec de nombreusesirrégularités. Les formes fléchies d'un verbe peuvent être très différentes les unes des autres. Il faut une bonne connaissance de la grammaire géorgienne pour remonter à l'infinitif (le lemme d'accès des dictionnaires le plus fréquent). L'accès aux dictionnaires pour les débutants est, de ce fait, très difficile. De plus, il n'y a pas de consensus parmi les lexicographes du Géorgien sur les lemmes qui représentent un verbe dans les dictionnaires,ce qui complexifie encore davantage les accès.Nous proposons Kartu-Verbs, une base de formes fléchies de verbes géorgiens accessible par un système d'informations logiques. Cette démonstration montre comment, à partir de n'importe quelle forme fléchie, on peut trouver le lemme pertinent pour accéder à n'importe quel dictionnaire. Kartu-Verbs peut, ainsi,être utilisé comme une interface aux dictionnaires géorgiens.}
}