Vous êtes ici

Gestion efficace de données à l’aide d’ontologies expressives : Application au fact-checking

Equipe et encadrants
Département / Equipe: 
Site Web Equipe: 
https://www.irisa.fr/fr/equipes/shaman
Directeur de thèse
François Goasdoué
Co-directeur(s), co-encadrant(s)
Jaudoin
Contact(s)
NomAdresse e-mailTéléphone
Goasdoué
fg@irisa.fr
0296469045
Sujet de thèse
Descriptif

L’équipe SHAMAN de l’IRISA, localisée à Lannion, contribue depuis quelques années à l’outillage informatique des salles de rédaction pour aider les journalistes au quotidien. Ce sujet fait l’objet de collaborations avec Les Décodeurs du quotidien ’’Le Monde’’, ainsi qu’avec Ouest France. Il a conduit à la conception d’un système, appelé médiateur, pour répondre de façon automatique à une question posée en exploitant leurs sources de données hétérogènes, et à un système qui stocke des informations importantes afin d’automatiser par la suite les recherches sur « Qui a dit quoi et quand ? » dans de grands volumes de données. Néanmoins, dans ces travaux, les données sont représentées dans le standard RDF du W3C, qui ne permet pas modéliser certaines informations primordiales pour des journalistes, par exemple des contraintes d’intégrité ou de cardinalité.

Ainsi, l’objectif de cette thèse est double.

Il s’agit tout d’abord d’étudier la gestion efficace de données dans OWL2 QL du W3C qui pallie les manques de représentation de RDF. OWL2 QL se fonde sur les logiques de description et se classe dans les modèles de données déductifs à expressivité pragmatique. Toutefois, l’efficacité des systèmes de gestion de données pour ce modèle est un challenge scientifique en bases de données, intelligence artificielle et web sémantique, avec un fort potentiel d’applications pratiques.

Il s’agit ensuite de poursuivre l’outillage numérique des journalistes en automatisant des tâches quotidiennes aussi fastidieuses que nécessaires, en bénéficiant du surcroît d’expressivité de ce nouveau formalisme. On pourrait par exemple automatiser la recherche de « Qui se contredit ou a changé d’avis sur tel sujet ? » et éventuellement suggérer des causes possibles à cela. 

La validation de nos travaux s’effectuera avec l’aide des journalistes de Ouest France à Rennes et des étudiants en journalisme de l’IUT de Lannion. Nous envisageons également de solliciter les journalistes du magazine Sciences Ouest à Rennes qui ont été intéressés par nos travaux ; Sciences Ouest a consacré un reportage sur nos travaux dans son numéro d’octobre 2019.

Bibliographie

Franz Baader, Diego Calvanese, Deborah L. McGuinness, Daniele Nardi, Peter F. Patel-Schneider: The Description Logic Handbook: Theory, Implementation, and Applications. Cambridge University Press, 2003, ISBN 0-521-78176-0

Damian Bursztyn, François Goasdoué, Ioana Manolescu: Teaching an RDBMS about ontological constraints. Proceedings of the Very Large Data Bases Endowment (PVLDB) 9(12): 1161-1172, 2016

Damian Bursztyn, François Goasdoué, Ioana Manolescu: Optimizing FOL Reducible Query Answering: Understanding Performance Challenges. International Semantic Web Conference (ISWC), 2016

Ludivine Duroyon, François Goasdoué, Ioana Manolescu: A Linked Data Model for Facts, Statements and Beliefs. International Workshop on Misinformation, Computational Fact-Checking and Credible Web. The Web Conference (WWW), Companion Volume, 2019: 988-993

Tien Duc Cao, Ludivine Duroyon, François Goasdoué, Ioana Manolescu, Xavier Tannier: BeLink: Querying Networks of Facts, Statements and Beliefs. ACM International Conference on Information and Knowledge Management (CIKM), 2019: 2941-2944

Interviews de Ludivine Duroyon et François Goasdoué dans le dossier « Vrai ou faux ? A la recherche des fake news », Sciences Ouest, n°375, octobre 2019

Maxime Buron, François Goasdoué, Ioana Manolescu, Marie-Laure Mugnier: International Conference on Extending Database Technology (EDBT), 2020 (à paraître)

Début des travaux: 
octobre 2020
Mots clés: 
bases de données déductives, logiques de description, interrogation efficace de données, raisonnement automatique, fact-checking
Lieu: 
IRISA - Enssat, Lannion (22300)