Méthodologies pour l'Analyse Reproductible des Workflows Edge-to-Cloud / Methodologies for Reproducible Analysis of Workflows on the Edge-to-Cloud Continuum

Defense type
Thesis
Starting date
End date
Location
IRISA Rennes
Room
Amphitheâtre G
Speaker
Daniel ROSENDO, équipe KERDATA
Theme

La soutenance de thèse de Daniel Rosendo, équipe KERDATA, se déroulera le 1er juin, à 9h30, en Amphi G, du centre IRISA-Inria de l’Université de Rennes.

Méthodologies pour l'Analyse Reproductible des Workflows Edge-to-Cloud

Les infrastructures distribuées pour le calcul et l'analyse évoluent désormais vers un écosystème interconnecté permettant l'exécution d'applications complexes dans le continuum Edge-to-Cloud. Comprendre et optimiser les performances de bout en bout dans ce contexte est un défi majeur. Un besoin crucial consiste à reproduire avec précision les comportements pertinents des workflows et les paramètres représentatifs de l'infrastructure physique sous-jacente. Cela nécessite de concilier de nombreuses exigences et contraintes applicatives, généralement contradictoires, avec des choix de conception d'infrastructure de bas niveau.
Cette thèse est une contribution conceptuelle et pratique au continuum Edge-to-Cloud, proposant des méthodologies et les appliquant dans des environnements novateurs. Nos méthodologies ont pour but de s'affranchir de la complexité de la compréhension et de l'optimisation des workflows dans le continuum Edge-to-Cloud. Ainsi, elles permettent la conception d'expériences reproductibles, l'optimisation des applications, la capture efficace des données de provenance des exécutions de workflows, et la reproductibilité des expériences.
Nous avons validé notre proposition avec, d'abord, le développement du framework E2Clab qui supporte le cycle complet d’analyse d’une application dans le continuum Edge-to-Cloud, et ensuite, l'utilisation de E2Clab pour l'optimisation Pl@ntNet, une application mondiale d'identification des plantes. La validation expérimentale à grande échelle sur Grid'5000 montre que notre méthodologie s'est avérée utile pour comprendre et améliorer les performances de Pl@ntNet.

 

Daniel Rosendo n’s PhD defense, KERDATA team, will take place on 2032, June 1st, at 9:30 AM, in the Amphitheater, IRISA-University Rennes 1 Inria center.

Methodologies for Reproducible Analysis of Workflows on the Edge-to-Cloud Continuum
Distributed infrastructures for computation and analytics are now evolving towards an interconnected ecosystem allowing complex applications to be executed on the Edge-to-Cloud continuum. Understanding and optimizing end-to-end performance in such a complex continuum is challenging. One crucial challenge is accurately reproducing relevant behaviors of a given application workflow and representative settings of the physical infrastructure underlying this complex continuum. This breaks down to reconciling many, typically contradicting application requirements and constraints with low-level infrastructure design choices.
This thesis is a conceptual and practical contribution to the Edge-to-Cloud continuum, proposing and applying methodologies in novel environments. Our methodologies aim at overcoming the complexity of understanding and optimizing Edge-to-Cloud workflows. As such, they enable reproducible experiment design, application optimization, efficient workflow provenance capture, and cost-effective experiment reproducibility.
We validated our proposal by first developing the E2Clab framework that supports the complete analysis cycle of an application on the Edge-to-Cloud Continuum and then using E2Clab to optimize Pl@ntNet, a global plant identification application. Large-scale experimental validation on Grid'5000 shows that our methodology has proven helpful for understanding and improving the performance of Pl@ntNet.

 

Composition of the jury
Rosa BADIA, directrice de recherche, Barcelona Supercomputing Center, Espagne (rapportrice)
Ewa DEELMAN, directrice de recherche, USC Information Sciences Institute (University of South California), USA (rapportrice)
María PEREZ, professeure, Universidad Politécnica de Madrid, Espagne (examinatrice)
Gabriel ANTONIU, directeur de recherche, Inria, Rennes (directeur de thèse)
Alexandru COSTAN, maître de conférences, INSA Rennes (co-directeur de thèse)
Patrick VALDURIEZ, directeur de recherche, Inria, Montpellier (co-directeur de thèse)