Основа эффективного ввода-вывода в параллельные файловые системы (PVFS) – одновременная запись на диски многих вычислительных узлов суперЭВМ. Для обеспечения этого на всех узлах предназначенных для ввода-вывода, запускаются серверы ввода-вывода (СВВ), которые и хранят данные пользовательских файлов. Помимо этого, в системе есть (единственный) сервер метаинформации (метасервер) и естественно, клиенты файловой системы. Операции с метаинформацией (открытие, опрос атрибутов) требуют участия метасервера, но ввод-вывод данных идет напрямую между клиентом ФС и узлом ввода-вывода. Такая архитектура сочетает простоту реализации и высокую эффективность на типичных масс-параллельных задачах. Основная проблема, которая возникает при использовании PVFS для создания сбалансированных по вводу-выводу программных архитектур – надежность работы PVFS на конфигурациях с сотнями узлов ввода-вывода. После анализа типичных сбоев и сценариев использования файловых систем предложена и реализована концепция резервных СВВ, призванная решить эту проблему и обеспечить масштабирование. Суть резервных СВВ – в создании пула для горячей замены основных СВВ, тогда те становяться недоступны. Однако в данной работе изложение сосредоточено не на надежности, а на проектных решениях, влияющих на производительность.