Das Patchen eines ESXi Hosts über den Update Manager ist normalerweise eine eher unspektakuläre Standard-Prozedur. Installieren – Reboot – Fertig!
Ich war etwas erstaunt, als mir ein Kunde berichtete, er habe nach dem Neustart eine VM verloren [Anm.: Diese VM wird per DRS-Regel auf dem Host gehalten und mit diesem beendet und gestartet.]. Ein kurzer Blick auf den Host erklärte den Umstand. Die VM war unerreichbar, da der Host keine (!) Datastores mehr hatte. Die Datastores hatte er verloren, weil er auch keine Fibre-Channel HBA mehr hatte. Der Qlogic QLE2692 war einfach nur weg. Die PCIe Karte war natürlich noch im Server und blinkte munter vor sich hin. 😉
Hardware defekt ?
Wieder einmal war Troubleshooting angesagt. Standardprozedur beim Verdacht auf Hardwarestörung ist nach dem Neustart des Servers (kein Erfolg) die komplette Trennung des Servers von der Stromversorgung. Ein Kaltstart beseitigt hin und wieder Störungen in der Hardware. Aber auch das brachte hier keinen Erfolg. Der Dual-Port HBA blieb verschwunden – zumindest aus der Sicht des ESX-Servers.
Zur Diagnose bootete ich den Server in das Adapter-BIOS (Ctrl-Q). Dort war der HBA vorhanden und konnte sogar seine Storage-Targets auflisten. Ein Hardwaredefekt war also wenig wahrscheinlich.
Treiber ?
Der nächste Verdächtige ist der VMware Treiber. Gab es eine Änderung in der HCL, oder wurde mit dem Update ein Treiber getauscht? Dies ermittelt man auf der Shell.
esxcli software vib list
Der Befehl gibt alle VIB aus, die beim nächsten Neustart aktiv sein werden. Der gesuchte HBA-Treiber ist qlnativefc.
Name Version Vendor Acceptance Level Install Date qlnativefc 2.1.50.0-1vmw.600.3.57.5050593 VMware VMwareCertified 2017-04-10
Interessant ist hier das Install Date (2017-04-10). Dies war genau der Tag des ESX Updates. Somit kann man die Frage nach dem Treiber Update klar mit ‘ja’ beantworten.
Die nächste Frage ist die Kompatibilität mit der Hardware / Firmware. Dazu gibt die VMware HCL Auskunft.
Die Firmware des HBA hatte zum fraglichen Zeitpunkt die Version 8.03.03. Wie im Bildschirmausschnitt erkennbar, Passt der Treiber zur Hardware, zu dessen Firmware und zur ESXi Version 6.0 U3.
Wo also liegt das Problem?
Die Tabelle zeigt auch, daß es inzwischen einen aktuelleren Treiber gibt. Ich habe diesen als Patch in den Update-Manager importiert und als Host Extension Baseline dem fraglichen ESX-Server bereitgestellt. Nach Installation und Neustart waren beide vmhba Adapter sichtbar und auch alle Storage-Targets.
[Update]: Inzwischen hat auch VMware erkannt, daß in der Kombination mit dem qlnativefc und ESXi 6.0 U3 ein Problem besteht und dies in KB2149780 beschrieben.