Ungewöhnliches CPU Problem nach Update auf ESXi 7.0b

Für ESXi 7.0 GA wurde am 23. Juni 2020 ein Patch veröffentlicht, der einige Sicherheitskorrekturen und Bugfixes mit sich bringt. Die Version wird damit von ESXi 7.0 GA auf ESXi 7.0b angehoben.

Üblicherweise aktualisiere ich die Hosts in meinem Homelab sehr zeitnah. Da alle Hosts im Einklang mit der HCL sind, entschied ich mich für ein vollautomatisiertes Update durch den vSphere Lifcycle Manager (vLCM).

Die Spezifikation

ServerSuperMicro SYS-E300-9D-8CN8TP
BIOS1.3
ESXi7.0 GA build 15843807 (zuvor) / 7.0b build 16324942 (danach)
HCL ja

Nach dem ersten Host-Neustart bemerkte ich eine Warnleuchte am Servergehäuse und auch die Lüfter drehten mit maximaler Geschwindigkeit (was nicht zu überhören ist). Ein kurzer Blick ins IPMI zeigte, dass die CPU Temperatur einen kritischen Wert erreicht hatte.

Wie man im Screenshot erkennen kann, ist die Gehäusetemperatur moderat und die Lüfter drehen bei diesen Bedingugen normalerweise mit geringer bis mittlerer Drehzahl. Die Temperatur der Ansaugluft betrug 25°C. Im Bild unten kann man sehen, dass nur Lüfter 1+2, welche für die Kühlung der CPU verantwortlich sind am Maximum arbeiten. Lüfter B, der PCI und LAN Komponenten kühlt, dreht weiterhin mit niedriger Leistung.

Meine ESXi Knoten starteteten nach dem Update korrekt mit der neuen Buildnummer 16324942 und es gab keine Fehlermeldungen im vLCM. Man konnte jedoch deutlich hören, dass etwas nicht in Ordnung war. Ein 4cm Gehäuselüfter der am Maximum dreht, teilt einem das unmissverständlich mit. Auffallend war ausserdem, dass der Bootvorgang deutlich länger dauerte als üblich.

Ich habe den Cluster schnellstens herunter gefahren, um eine Kernschmelze in der CPU zu vermeiden.

„Ungewöhnliches CPU Problem nach Update auf ESXi 7.0b“ weiterlesen

Ruhe bitte! – Leise Lüfter fürs Homelab

Server und Switches sind gebaut für den Einsatz im Rechenzentrum. Geräuschbelästigung ist dort nur ein untergeordnetes Thema. Der Fokus liegt auf maximaler Leistung und Kühlung. Im Homelab sieht die Sache dagegen anders aus. Serverräume in privaten Haushalten dürften eher die Ausnahme sein und so stehen die meisten Homelabs irgendwo in der Nähe des Schreibtischs. Dort kann ein Gehäuselüfter mit hoher Drehzahl sehr störend sein.

Für meinen vSAN Cluster verwende ich einen Netgear XS716T 10 Gigabit Switch. Beim Systemstart drehen dessen Lüfter auf Maximum, um sich dann im Normalmodus bei geringerer Drehzahl einzupendeln. Aber auch die geringere Geräuschentwicklung ist auf die Dauer immer noch störend.

Neue Lüfter braucht das Land.

Im Rahmen eines Bastelexperiments versuchte ich das Geräuschproblem in den Griff zu bekommen und besorgte ein paar der in der Homlab Szene beliebten Noctua Lüfter. In den Netgear Switch passen zwei 40mm Lüfter. Diese sollten durch zwei Noctua NF-A4x20 ersetzt werden. Ein simpler Austausch wäre allerdings etwas unbefriedigend. Schließlich sollte das Ergebnis auch quantifiziert werden.

Wir sehen im Bild unten die Original Lüfter des Netgear Switches. Das 16 Port Modell ist mit zwei Lüftern ausgestattet und die 8-Port Variante mit einem.

Hinweis Nr.1: Achtung! Vor der Abnahme der Gehäuseabdeckung ist natürlich die Stromversorgung zu trennen!

Hinweis Nr.2: Bei Öffnen des Gehäuses droht Garantieverlust.

„Ruhe bitte! – Leise Lüfter fürs Homelab“ weiterlesen

VMware vExpert 2020 Bewerbung (2. Runde)

Das vExpert-Programm wurde von VMware gegründet, um Mitglieder der Community für die Verbreitung und Bekanntmachung der Produkte und Dienstleistungen von VMware zu belohnen. Jedes Jahr wird der Titel vExpert an Personen verliehen, die in herausragender Weise zur Gemeinschaft beigetragen haben. Das können Blogger, Autoren, öffentliche Redner, VMUG-Leader, VMTN-Mitglieder, VCDX und andere IT-Experten sein, die ihr Wissen teilen und weitergeben.

Bewerbung

Zweimal jährlich können sich Interessenten für das vExpert Progrmm bewerben. Derzeit ist gerade der Bewerbungszeitraum für das 2. Halbjahr geöffnet.

Warum vExpert werden?

Ja, es gibt Vorteile und Vergünstigungen (darauf werde ich später zurückkommen), aber darum geht es eigentlich nicht. Als vExpert geht es nicht darum, was man zurück bekommt, sondern was man selbst geben kann. Viele vExperts investieren einen großen Teil ihrer Freizeit in die Gemeinschaft. Die Vorbereitung eines Blog-Posts, einer VMUG-Präsentation oder die Organisation einer VMUG-Sitzung nimmt viel Zeit in Anspruch. Für diese Community-Arbeiter wurde das vExpert-Programm ins Leben gerufen.

Seit ich dem vExpert-Programm beigetreten bin, habe ich viele Freunde in der Community gewonnen. Auch wurde ich als Neuling von erfahrenen vExperts sehr herzlich willkommen geheißen. Um hier nur einige zu nennen: Ather Beg aus Großbritannien, Andreas (Lessi) Lesslhumer aus Österreich und Vladan Seget aus Reunion.

„VMware vExpert 2020 Bewerbung (2. Runde)“ weiterlesen

Storage Praxis – Das Synchronspiegel Dilemma

Eine kleine Einführung in die Hochverfügbarkeit

Datenbestände an zwei Orten identisch zu halten, wird in der hochverfügbaren IT immer wichtiger. War dies noch vor einigen Jahren ein sehr teurer Luxus für das Enterprise Segment, so dringt diese Anforderung in den letzten Jahren immer weiter in den SMB Bereich vor. Diese Methode nennt man Spiegel und sie kann prinzipiell auf zwei Arten umgesetzt werden:

  • asynchron – Der Datenabgleich erfolgt in definierten Intervallen. Dazwischen herrscht eine Differenz zwischen Quelle und Ziel.
  • synchron – Der Abgleich erfolgt transaktionsgenau, sodaß der Datenbestand zu jedem Zeitpunkt auf beiden Seiten identisch ist. Ein Schreibvorgang gilt erst als abgeschlossen, wenn auch Spiegelziel den Schreibvorgang bestätigt hat.

Eine Voraussetzung für Hochverfügbarkeit ist die Spiegelung der Daten (synchron, oder asynchron). Sind die Daten an zwei Orten (Rechenzentren) vorhanden stellt sich eine weitere Designfrage: Soll das Speicherziel als Kopie für den Notfall fungieren (Active-Passive), oder soll an beiden Orten aktiv mit den Daten gearbeitet werden (Active-Active)?

  • Active-Passive – In diesem Fall wird nur auf der aktiven Seite gearbeitet und die Daten auf die passive Seite übertragen (synchron oder asynchron). im Fehlerfall wird automatisch oder manuell (je nach Modell) umgeschaltet und die vorher passive Seite wird zur aktiven Seite. Sie bleibt dies, bis eine erneute Umkehr ausgelöst wird (Failback). Der Vorteil dieses Verfahrens ist, dass auch im Fehlerfall konstante Leistung garantiert werden kann. Die Ausstattung der passiven Seite muss natürlich identisch mit der aktiven sein. Der Nachteil besteht darin, dass nur maximal 50% der Ressourcen genutzt werden. Die anderen 50% stehen für den Fehlerfall bereit.
  • Active-Active – Hier werden die Ressourcen beider Seiten parallel genutzt und die Hardware kann somit effizienter eingesetzt werden. Dies bedingt aber, dass im Fehlerfall die Hälfte der Ressourcen wegfällt und somit nicht die volle Leistung garantiert werden kann. Active-Active Designs erfordern einen Synchronspiegel, da beide Seiten mit identischen Daten arbeiten müssen.

Active-Active Cluster gibt es in vielfacher Ausprägung. Es gibt klassischen SAN-Storage mit integrierter Spiegelfunktion, oder Software-defined-Storage (sds) bei der die Spiegelung nicht in Hardware, sondern in der Software-Schicht erfolgt. Ein Beispiel dafür ist DataCore SANsymphony. Eine Sonderrolle nimmt hier der VMware vSAN Stretched Cluster ein, der aber nicht Gegenstand dieser Betrachtung sein wird.

Ich werde im folgenden Abschnitt auf eine Besonderheit von LUN basierten active-active Konstrukten eingehen, die leider oft übersehen wird, aber im Fehlerfall zu Datenverlust führen kann. VMware vSAN ist hiervon nicht betroffen, da dessen Stretched Cluster auf einem grundlegend anderen Verfahren beruht.

„Storage Praxis – Das Synchronspiegel Dilemma“ weiterlesen