Действия при выходе из строя СХД с размещенным HOSTVM Manager
Данная статья описывает порядок действий при выходе из строя СХД с размещённой управляющей машиной
Для восстановления работоспособности кластера в случае выхода из строя СХД с размещённой управляющей машиной, если её невозможно восстановить, необходимо выполнить следующие действия:
1. Проверьте статус HOSTVM Manager
Выполните на гипервизоре команду:
hosted-engine --vm-status
Если Manager недоступен, переходите к следующим шагам.
2. Проверьте наличие зависших виртуальных машин
На каждом гипервизоре выполните команду:
virsh list --all
Данные для подключения к virsh (логин и пароль) указаны в файле:
/etc/ovirt-hosted-engine/virsh_auth.conf
3. Выполните принудительное завершение работы зависших ВМ
Для каждой зависшей ВМ выполните команду:
virsh destroy VM_NAME
4. Проверьте состояние и очистите неиспользуемые multipath-устройства
На всех узлах кластера выполните следующие команды:
Для просмотра состояния устройств:
multipath -ll
Для очистки неиспользуемых устройств:
multipath -F
5. Убедитесь, что проблемное хранилище отключено
На узлах кластера выполните следующие команды:
Для просмотра блочных устройств:
lsblk
Для проверки multipath-устройств:
multipath -ll
6. При необходимости восстановите работу HOSTVM Manager
Подключите новое хранилище (SAN/NFS/iSCSI) или настройте локальное хранилище NFS.
Переустановите HOSTVM Manager на новое хранилище.
Внимание!
При попытке восстановить предыдущую версию Manager после переустановки:
Возникнет конфликт, приводящий к отказу системы
Все настройки кластера (HA, DRS, сети) потребуется перенастроить вручную
Last updated
Was this helpful?