Техники за толерантност към повреди в библиотеката с шаблони C за паралелизиране на T-Sim


За всички въпроси, свързани с работата в системата на Science Index, моля, свържете се със службата за поддръжка:
Документът се занимава с проблемите на толерантност към паралелни приложения при работа на разпределени изчислителни съоръжения. Увеличаването на мащаба на съвременните изчислителни системи води до увеличаване на вероятността за отказ на отделни елементи от системата. В някои случаи изчислителните алгоритми, като генетични алгоритми, алгоритми, използващи метода на Монте Карло и др., Допускат възможността за отказ на един или няколко елемента. Статията предлага методи за внедряване на такива алгоритми и осигуряване на тяхната производителност при условие за софтуерни и хардуерни неизправности на изчислителните възли. В рамките на библиотеката C ++ T-Sim е разработен пример за редукционен (монотонен) обект, както и няколко алтернативни механизма за рестартиране на задачи. Пробни неуспешни реализации на алгоритъма.