Fault tolerance
Fault tolerance je schopnost systému pokračovat ve svém provozu bez přerušení i v případě výpadku jedné nebo více jeho komponent.
Hlavními cíli fault tolerance je minimalizovat dopad chyb na běh systému a zajistit vysokou dostupnost. Fault tolerance se využívá v aplikacích a systémech, u kterých je potřeba zajistit nepřetržitý provoz. Je to např. chod datových center, provoz cloudových služeb nebo finančních systémů.
K dosažení fault tolerance se často využívají následující metody:
- použití redundantních komponent;
- zálohování dat;
- implementace mechanismů pro detekci výpadků a automatickou obnovu;
- load balancing;
- škálovatelnost.