Fault Tolerance and Resilience Computing

In diesem Forschungsbereich beschäftigen wir uns mit fehlertoleranten Rechenerarchitekturen und Softwaresystemen. Ein wichtiger Forschungsgegenstand ist die zukünftige Höchstleistungsinfrastruktur in Richtung ExaScale. Auch untersuchen wir den Einsatz von Commercial Off the Shelf(COTS)-Bauteilen in Rechensystemen mit hohen Verfügbarkeitsanforderungen. Wir kooperieren dabei eng mit dem Lehrstuhl für Raumfahrtechnik an der Fakultät für Maschinenwesen und forschen gemeinsam an Low-Budget Rechensystemen für den Einsatz im Weltall und für Avioniksysteme. 

Durch die zunehmend kleineren Fertigungs- und Fabrikationstechnologien steigt die Fehlerwahrscheinlichkeit. Daher müssen für künfitige Recherinfrastrukturen neue Möglichkeiten zur Fehlerdektektion und Fehlervorhersage gefunden werden, die gleichzeitig eine hohe Effizienz und Genauigkeit garantieren. 

Desweiteren untersuchen wir in diesem Forschungsgebiet die Fehlerverbreitung (Fault Propagation) und Fehlerauswirkung (Failure Effect). Dazu entwicklen wir moderne Fehlerinjektoren, die möglichst realitätsnahe Szenarien abbilden können. 

 

Mitarbeiter: 

Dai Yang, M. Sc.

Dr.-Ing. Carsten Trinitis

PD Dr. rer. nat. habil. Josef Weidendorfer