понедельник, 11 апреля 2016 г.

VMware High Availability vs NVIDIA vGPU

Обновление: Начиная с версии vSphere 6.5 для vGPU появилась поддержка High Availability (для режима vDGA высокая доступность все еще не поддерживается): vSphere HA now protects VMs with the NVIDIA GRID vGPU shared pass-through device. In the event of a failure, vSphere HA attempts to restart the VMs on another host that has an identical NVIDIA GRID vGPU profile. If there is no available healthy host that meets this criterion, the VM fails to power on.
http://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/whitepaper/vsphere/vmw-white-paper-vsphr-whats-new-6-5.pdf

С момента появления поддержки аппаратного ускорения графики NVIDIA vGPU в vSphere 6.0, все больше заказчиков интересуются возможностью применения данной технологии в VDI средах. Однако, у vGPU есть ряд ограничений, которые требуется учитывать при планировании архитектуры решения.

Одним из таких ограничений является отсутствие поддержки отказоустойчивости VMware High Availability. Например, об этом сказано в одном из официальных документов: http://www.vmware.com/files/pdf/techpaper/vmware-horizon-6-view-virtual-desktop-3d-graphics-reference-architecture.pdf 


Но как мы все прекрасно знаем: "Не поддерживается не значит - не работает".

Проверка на стенде показала, что в случае vGPU все обстоит именно так, как написано. Даже если ВМ располагается в кластере с включенным HA, где на всех хостах установлены адаптеры NVIDIA GRID, при попытке включения ВМ возникнет ошибка Insufficient resources for vSphere HA to start the VM, а сама ВМ остается в статусе disconnected.

Что интересно - холодная миграция выключенной ВМ с хоста на хост, с последующим включением работает.

Отсутствие поддержки vMotion и HA при использовании vGPU существенно усложняет планирование высокодоступной VDI инфраструктуры. Частично решить данную проблему можно следующими способами:
  • При использовании dedicated пулов ВМ - создавать еще один пул, в котором будут находиться резервные ВМ, к которым пользователи будут подключаться, когда ВМ из основного пула станут недоступны.
  • Использовать floating пулы ВМ.
А для переноса рабочих данных, настроек и приложений пользователей можно использовать View Persona Management, User Environment Manager и App Volumes.

Комментариев нет:

Отправить комментарий