Топлоустойчиви изчислителни системи
Страници за работа





Съдържанието на произведението
1.3. Топлоустойчиви изчислителни системи
1.3.1. Операции, необходими за осигуряване на устойчивост на неизправности на изчислителната система
Толерантността към повреди се разбира като свойство на архитектурата BC, което й позволява да продължи изчислителния процес, дори ако възникне отказ в реалната система, която е негов носител. Неуспехите могат да бъдат софтуер и хардуер.
Има няколко подхода за осигуряване на толерантност към повреди, но всички те предполагат наличието на излишни, хардуерни или временни, или и двете.
Има два вида съкращения:
IN пасивен излишен системите имат достъп до резервни компоненти, които не са свързани с текущия изчислителен процес и трябва да бъдат активирани или модифицирани, за да приемат информация от неуспешния компонент.
Предаването на информация с този подход е трудоемък процес, който обикновено води до прекъсвания в работата на системата. състоянието по време на неуспеха се губи и поради това някои фрагменти от задачите трябва да бъдат решени отново. това увеличава времето за изчакване на резултатите, което е неприемливо за система в реално време.
Активно излишни системи включват допълнителни модули, които са свързани с основните в случай на отказ, са готови да продължат изчислителния процес. След определен период от време междинните резултати се запаметяват и могат да се използват за ускоряване на възстановяването на изчислителния процес.Такова резервно съхранение на междинни резултати се нарича контролна точка и като правило се определя на нивото на алгоритъма за решаване на приложен проблем.
За да се осигури толерантност към повреди в системата, трябва да се осигурят следните стъпки: