5 месяцев назад 9 сентября 2025 в 14:28 18473

Графические процессоры GeForce RTX 5090 и RTX PRO 6000 компании NVIDIA демонстрируют нестабильную работу в виртуальных средах. Проблема проявляется в виде полного отказа устройства при выполнении сброса через механизм PCIe Function-Level Reset. Устройства требуют полной перезагрузки физического сервера для восстановления работоспособности .

Ошибка возникает при использовании технологий виртуализации KVM и VFIO для передачи GPU виртуальным машинам. При завершении работы гостевой системы или переназначении устройства хост-система инициирует процедуру FLR, которая должна вернуть графический процессор в исходное состояние. Однако вместо этого оборудование перестает отвечать на команды, а в системных журналах появляется сообщение об ошибке: «not ready 65535ms after FLR; giving up» .

Провайдер облачных услуг CloudRift подтвердил наличие проблемы в производственной среде после тестирования нескольких систем на архитектуре Blackwell. Компания установила вознаграждение в размере 1000 долларов для специалистов, которые смогут предложить эффективное решение или определить первопричину сбоя .

Пользователи на форумах Proxmox и Level1Techs сообщают о схожих проблемах. В отдельных случаях наблюдаются полные зависания host-системы после завершения работы виртуальной машины Windows, при этом графический процессор не инициализируется даже после перезагрузки на уровне операционной системы .

Проблема затрагивает исключительно модели RTX 5090 и RTX PRO 6000. Тестирование более ранних решений, включая RTX 4090, а также серверные ускорители H100 и B200, не выявило аналогичных проблем даже при интенсивных рабочих нагрузках .

Компания NVIDIA официально признала существование проблемы и заявила о возможности ее воспроизведения. Представители компании работают над решением, которое должно быть представлено в будущих обновлениях программного обеспечения или драйверов .

Никто не прокомментировал материал. Есть мысли?