Problem mit Emulex OneConnect OCe14000 NIC LoM

Troubleshooting mit Treiber, Firmware und ESXi Versionen

Hardware Ausfälle sind in vSphere Clustern in der Regel keine große Sache. Nahezu jede Komponente ist redundant ausgelegt und bei Ausfall springt ein Ersatz ein. Schwieriger wird es, wenn eine Komponente nicht komplett ausfällt, sondern Fehlfunktionen zeigt. Ein so genannter Zombie ist viel kritischer, als ein Ausfall. Die Ersatzkomponente wird unter Umständen nicht einspringen, so lange noch irgendwelche Lebenszeichen von der gestörten Komponente kommen.

Ein solches Szenario erlebte ich bei dem geplanten Neustart eines Top-of-Rack (ToR) Switches. Der angeschlossene 10 Gbit Port eines ESXi Servers wurde nachhaltig gestört, aber er ist nicht ausgefallen.

Die aktiven Link-LEDs trotz entferntem Kabel sind ein untrügliches Kennzeichen, dass hier etwas nicht in Ordnung ist.

„Problem mit Emulex OneConnect OCe14000 NIC LoM“ weiterlesen

Upgrade ESXi 6.5 mit Fujitsu Custom Image

Konflikt mit VIB

Host Upgrade mit angepassten ESXi Images (sog. Custom Images) bieten ein erweitetes Angebot an Treibern und Hardware-spezifischen Agenten. Somit werden etwa Treiber bereitgestellt, die im VMware Standard (“Vanilla”) Image nicht vorhanden sind, oder ein erweitetes Monitoring der Hardware mit Agenten ist möglich. Führt man Upgrades von Customized Installationen durch, kommt es immer wieder zu Konflikten mit existierenden Paketen. Ein bekanntes Beispiel aus der Vergangenheit war der LSI-Provider in Fujitsu-Images beim Upgrade auf Version 5.1 oder der Tod durch Upgrade auf Version ESXi 6.0 mit Fujitsu Custom Images. Die Hall of Shame ließe sich beliebig erweitern. Auch andere OEM Hersteller sind hier nicht beser. „Upgrade ESXi 6.5 mit Fujitsu Custom Image“ weiterlesen

VMs ohne Tag emitteln

Backup-Tag SLA überprüfen

VMware Tags bieten vielseitige Möglichkeiten, VMs dynamisch anhand ihrer Tags zu gruppieren. Ein Anwendungsfalls sind die Verwendung von Backup-Tags, um Backup-SLA zu gewährleisten. In meinem Fall gibt es eine Kategorie mit Namen “Backup” und darunter mehrere SLA-Tags für wöchentliche, oder tägliche Backups.

Oneliner

Mittels PowerCLI lässt sich schnell ermitteln, welche VM keinen Tag gesetzt hat.

connect-viserver myVC
get-vm | ?{ (get-tagassignment $_) -eq $null}

Diese Abfrage ist aber noch nicht hinreichend. Sie ermittelt nur, welche VMs KEINE Tags haben. Ich möchte jedoch erfahren, welche VMs keine Tags der Kategorie “Backup” haben. Wir müssen dazu unsere Abfrage etwas anpassen.

get-vm | ?{ (get-tagassignment $_ -category Backup) -eq $null}

Die Kategorie “Backup” ist mit der jeweilig verwendeten Namensgebung anzupassen.

 

ESX physische Uplinks gegen Pfadausfall sichern

vmnic Redundanz mit Link State Tracking / Smartlinks absichern

Ein vSphere Cluster sollte in jeder Hinsicht redundant ausgelegt sein. D.h. der Ausfall einer Komponente darf nicht zum Funktionsverlust führen. Wir bilden RAID Sets aus mehreren Disks, steuern Storage Einheiten über mehrere Controller, haben mehrere Pfade zur Storage, redundante LAN- und SAN-Switches und mehrere Uplinks pro Host ins physische Netzwerk.

VMware vSphere verwendet mehrere physische Uplinks, um daraus einen logischen NIC zu erstellen. Somit wird Redundanz gewährleistet. Besonders für Kenelports ist Redundanz besonders wichtig. Über diese wird das Management Network, vMotion, FT, iSCSI und Heartbeats abgewickelt.

Es gibt aber Szenarien, bei denen alle NICs eines ESX physischen Link haben und dennoch ein Pfadausfall auf dem Weg zum Core-Switch dazu führt, daß Pakete ins Nirvana gesendet werden.

Wir werden im folgenden Teil mehrere Architekturen anschauen und Methoden zeigen, um dies zu verhindern. „ESX physische Uplinks gegen Pfadausfall sichern“ weiterlesen