Метод и аппаратура для организации обслуживания в кластерной компьютерной системе

Метод управления набором серверов кластерной компьютерной системы включает осуществляемые компьютером этапы: текущей проверки набора серверов для выявления поврежденных серверов в наборе; инициации отключения серверов в соответствии с выявленными повреждениями, чтобы правильно исключить поврежденные серверы из рабочего набора; и повторного запуска серверов, чтобы обеспечить нормальную дальнейшую работу исправных серверов. Отключение для вывода из работы неисправных серверов и повторный запуск серверов, после исключения неисправных, осуществляются с использованием сохраняемого в памяти списка серверов, в котором расписан порядок выполнения операций при отключении и повторном запуске. Пуск набора серверов со строгим порядком выполнения операций задается работающей в фоновом режиме сетевой программой демон, обеспечивающей процедуру автоматического запуска при выполнении определенных условий. Эта же программа управляет мониторингом состояния системы.