Tolérer les fautes transitoires, permanentes et intermittentes
Lorsque la taille d’un système réparti devient importante ou lorsque ce système est déployé dans un environnement non contrôlé, la probabilité que certains éléments du système subissent des fautes (panne, corruption de mémoire, piratage, …) devient non négligeable. Ces fautes peuvent être classifiées en fonction de leur durée, de leur étendue et de leur nature. Dans ce séminaire, nous nous intéressons aux systèmes répartis capables de tolérer simultanément plusieurs types de fautes à travers l’étude de trois problèmes fondamentaux. Nous présentons ainsi un protocole réparti simulant un registre atomique mono-écrivan multi-lecteurs en présence de fautes transitoires et de fautes permanentes de type crash. Ce protocole repose sur deux outils ré-utilisables : un protocole de communication et un système d’estampillage borné. Ensuite, nous proposons une étude de la synchronisation faible d’horloges logiques en présence de fautes transitoires et de fautes intermittentes Byzantines. Finalement, nous définissons trois nouveaux concepts de tolérance pour les systèmes répartis sujets à des fautes transitoires et des fautes intermittentes Byzantines. Nous donnons un protocole de construction d’une vaste classe d’arbres couvrants optimal selon ces trois concepts.