Fault Tolerance and Resilience Computing

In diesem Forschungsbereich beschäftigen wir uns mit fehlertoleranten Rechenerarchitekturen und Software Systemen. Ein wichtiger Forschungsgegenstand sind die zukünftige Höchstleistungsinfrastruktur in Richtung ExaScale. Auch untersuchen wir den Einsatz von Commercial Off the Shelf(COTS)-Bauteilen in Rechensystemen mit hoher Verfügbarkeitsanforderungen. Wir kooperieren eng mit dem Lehrstuhl für Raumfahrtechink an der Fakultät für Maschinenwesen zusammen und forschen gemeinsam an Low-Budget Rechensystemen für den Einsatz in Weltall und für Avioniksysteme. 

Durch die zunehmend kleineren Fertigungs- und Fabrikationstechnologien steigt die Fehlerwahrscheinlichkeit. Daher müssen für künfitige Recherinfrastrukturen neue Möglichkeiten zur Fehlerdektektion und Fehlervorhersage gefunden werden, die gleichzeitig eine hohe Effizienz und Genaurigkeit anbieten. 

Desweiteren untersuchen wir in diesem Forschungsgebiet die Fehlerverbreitung(Fault Propagation) und Fehlerauswirkung(Failure Effect). Dazu entwicklen wir moderne Fehlerinjektoren, die möglichst nah an der Realität sind. 

 

Mitarbeiter: 

Dai Yang, M. Sc.

Dr.-Ing. Carsten Trinitis

PD Dr. rer. nat. habil. Josef Weidendorfer