Host Upgrade scheitert mit Fehler „Cannot execute upgrade script on host“

Kürzlich hatte ich das Vergnügen, einen älteren ESXi 6.0 Host auf Version 6.7U3 zu aktualisieren. Kurz nachdem ich im Update-Manger auf „Standardisieren“ klickte, brach der Prozess mit folgender Fehlermeldung ab:

Cannot execute upgrade script on host

Diese Fehlermeldung ist nicht wirklich spezifisch. Wenn man sie googelt, findert man etwa ein Dutzend möglicher Usachen für das Scheitern. Diese können z.B. sein:

  • inkompatible Treiberpakete
  • volle vfat Partitionen
  • /bootbank/state.XXXXXXXX Verzeichnis ist nicht leer
  • Custom ISOs mit falscher Signatur für intel i40en Treiber Paket
  • Probleme mit FDM Agent (HA)

Keiner der oben genannten Punkte passte zu dem von mir beobachteten Problem. Ein guter Ausgangspunkt sollte ein Blick in vua.log auf dem betroffenen Host sein.

less /var/log/vua.log

Leider half das auch nicht weiter. Also schauten wir (nochmals) in die VMware Upgrade Matrix. Ein direktes Upgrade von ESXi 6.0 auf auf ESXi 6.7 U3 ist erlaubt, aber mit Einschränkung in einer kleinen Fussnote.

KB 76555 besagt, dass es ein Problem mit veralteten VIB Zertifikaten auf Hosts unterhalb einer bestimmten Buildnummer gibt.

  • ESXi 6.0 GA vor Build 9239799
  • ESXi 6.5 GA vor Build 8294253

Tatsächlich hatte unser ESXi Host eine Buildnummer von 7967664 (U3e), die sich im kritischen Bereich befand. Wir mussten also einige Patches nachinstallieren bis zum Stand Juni 2018 (ESXi600-201807001). Danch funktioniete das Upgrade problemlos.

Was war schiefgelaufen?

Natürlich hatten wir die Matrix während der Planungsphase Anfang März 2020 überprüft. Das ist eine Standardprozedur. Leider hat sich in der Zwischenzeit an der Matrix etwas geändert (die Fußnote wurde hinzugefügt). KB 76555 wurde im Mai 2020 aktualisiert, und das Problem betrifft Upgrades auf ESXi 6.7 Versionen nach dem 28. April 2020.

Was kann man daraus lernen? Unmittelbar vor Beginn der praktischen Arbeiten an einem Projekt nochmals alle Abhängigkeiten überprüfen.

VeeamON Tour 2020 Virtual Event

22. Juni 2020 9:30 – 13:30 CEST

Die Veeam Roadshow findet dieses Jahr virtuell statt.

Themen

  • Überblick über die Neuerungen im Veeam-Produktportfolio, z. B. die NEUE Veeam Availability Suite™ v10
  • Zugriff auf den Live-Stream und On-Demand-Inhalte
  • Technische Deep-Dive-Sessions zu Trendthemen von Veeam Systems Engineers
  • Informationen zu den Möglichkeiten der Cloud für eine skalierbare, effiziente Datensicherung
  • Networking mit anderen IT-Professionals und Branchenexperten

Referenten

  • Anton Gostev – Senior Vice President, Product Management
  • Danny Allan – CTO and SVP Product Strategy
  • Stefano Heisig – Senior Systems Engineer, DE
  • David Bewernick – Senior Systems Engineer, DE
  • Benedikt Däumling – Senior Systems Engineer, DE
  • Marco Horstmann – Senior Systems Engineer, DE
  • Stephan Herzig – Systems Engineer, CH
  • Herbert Szumovski – Systems Engineer, AT
  • Ivan Cioffi – Systems Engineer, CH
  • Andreas Lesslhumer – Systems Engineer, AT

VMUG Deutschland Virtual Events 2020

In Folge der Corona-Krise musste die Deutsche VMUG UserCon auf den 11. Dezember 2020 verschoben werden. In der Zwischenzeit organisieren wir alle zwei Wochen kurze einstündige virtuelle Veranstaltungen zu einem ausgewählten Thema.

Den Auftakt macht Niels Hagoort, Co Autor von Host Resources Deep Dive und Clustering Deep Dive.

Die Teilnahme erfolgt über Zoom und ist wie immer kostenlos. VMUG Registrierung wird benötigt.

vBeers

Im Anschluss an das Virtual Event veranstalten unsere regionalen VMUG Usergroups ein vBeer mit allgemeiner Diskussion.

Elasticsky.de wieder online

Am vergangenen Montagabend kam es zu massiven Störungen im Betrieb dieser Blog Webseite. Der Seitenaufbau war gestört und Besucher bekamen eine „Internal Server Error“ Meldung anstatt der Startseite.

Wir bitten die Störung zu entschuldigen und freuen uns auf zukünftige Besuche der Seite.

Auch wenn es sich wie ein Angriff anfühlte, lag die Ursache in einem Konfigurationsfehler, der sich aber nicht sofort auswirkte, sondern erst einige Stunden nach der Änderung. Die Fehlersuche wurde erschwert, da zwei Veränderungen in kurzem Abstand vorgenommen wurden und der vermeintliche Auslöser eigentlich unschuldig an der Misere war.

Memo an mich selbst: Vorsicht mit Hosting-Funktionen, die man nicht zu 100% versteht und immer nur einen Parameter ändern.