|
Étude de la tolérance à différents types de défaillances
Localisation :Irisa, Rennes
Equipe ADP
Responsables :
Mot-clés : Système réparti asynchrone, tolérance aux défaillances,
communication de groupe, panne franche, recouvrement, faute byzantine.
Financement : A définir.
Sujet : Pour de nombreuses applications critiques, la sûreté
de fonctionnement est un critère de qualité de service essentiel.
Depuis deux ans, un des axes de recherche du projet ADP est consacré
à la conception et au développement de services permettant de garantir
cette contrainte non-fonctionnelle dans un environnement répartie
asynchrone. La tolérance aux défaillances peut être obtenue en dupliquant
des composants du système. Le maintien de la cohérence entre les
copies d'un même composant nécessite alors des prises de décision
unanimes au sein du groupe de copies. L'absence d'horloges synchronisées
et l'absence de bornes sur les temps de transfert des messages rendent
ces prises de décision complexes.
La sûreté de fonctionnement ne peut être garantie que pour des
types de défaillances préalablement identifiés. Jusqu'ici, nous
n'avons considéré que des défaillances de type pannes franches :
dans ce contexte, chaque copie peut, soit s'exécuter correctement,
soit s'interrompre brutalement (et définitivement) suite à une panne.
L'objectif de cette thèse est d'étudier de nouveaux types de défaillances
(pannes avec recouvrement, fautes byzantines, ...) et de proposer,
afin de les prendre en compte, des extensions au prototype de gestion
d'objets dupliqués développé (en JAVA) au sein du projet ADP. Des
études préliminaires montrent que la stratégie actuellement adoptée
pour développer les services de communication de groupe (utilisation
d'un service de consensus générique) est compatible avec la prise
en compte de ces nouveaux types de défaillances.
File translated from TEX
by TTH,
version 2.25.
On 8 Mar 2000, 15:33. |