|
Transformation de questions écrites en requêtes
SQLf
Localisation :ENSSAT, Lannion
Responsable : Laurent MICLET (tél. direct : 02 96
46 66 28, email : miclet@enssat.fr)
Patrick BOSC (tél. direct : 02 96 46 66 45, email : bosc@enssat.fr)
Mot-clés : Apprentissage de transducteurs, traitement de
la langue naturelle, interrogation flexible de bases de données.
Sujet : Le projet BADINS a développé (sous le
nom de SQLf) une extension du langage SQL d'interrogation des Bases
de Données, autorisant la requête à intégrer
des paramètres d'imprécision. Par exemple, si ">>"
représente le "comparateur graduel" beaucoup plus grand
(dont la sémantique est donnée sous la forme de fonction
d'appartenance floue), la phrase :
"trouver les jeunes employés dont le salaire est beaucoup
plus élevé que celui des autres employés du même
département"
s'écrit en SQLf :
select #emp, nom from EMP E where
age = jeune and salaire >> all
(select salaire from EMP where #dep
= E.#dep and #emp ¹ E.#emp)
Le but de la thèse est l'apprentissage automatique d'un outil
de traduction, à partir de corpus de couples (phrase en français,
requête SQLf) de même sémantique. Une fois la phase
d'apprentissage terminée, une phrase en français pourrait
donc être traduite automatiquement en requête SQLf pour
interroger la base de données. L'outil de traduction qu'il
est envisagé d'apprendre est une forme d'automate fini avec
sortie, appelé transducteur. Le travail consistera
donc à se familiariser avec la théorie et la pratique
de l'apprentissage (ou inférence) des transducteurs,
ainsi qu'avec les langages SQL et SQLf. La biliographie sur le passage
du texte écrit aux requêtes SQL devra également être
faite. Il faudra ensuite construire un corpus d'apprentissage et
tester un algorithme existant. Enfin, il s'agira de développer
des heuristiques propres à ce problème et de concevoir
un algorithme d'apprentissage spécifique. Une question ouverte
est si la totalité de SQLf pourra être traitée ainsi,
ou s'il faudra définir des sous-ensembles syntaxiques où
l'apprentissage sera efficace.
File translated from TEX
by TTH,
version 2.25.
On 8 Mar 2000, 15:33. |