Microsoft Cluster auf VMware vSphere 5.1

Der Fluch der VMware hat wieder mal zugeschlagen vor einiger Zeit.

Es kam die Anforderung das meherere virtuelle Microsoft Cluster betrieben werden müssen.

Nachfolgend ein paar kurze Tipps für den Betrieb:

Bei der Erstellung des Clusters umbedingt folgendes Whitepaper befolgen:
http://pubs.vmware.com/vsphere-51/topic/com.vmware.ICbase/PDF/vsphere-esxi-vcenter-server-51-setup-mscs.pdf

Diskkonfiguration

vmsettings_clusternodeBesonderes Augenmerk auf die Konfiguration der Clusterdisken richten. Hier können keine vmdk’s verwendet werden. Es müssen zwingend RDM LUN’s physical verwendet werden (pro Clusterdisk eine LUN).

Weiters die Clusterdisken auf einen eigenen SCSI Controller hängen der ebenfalls im physical Mode ist. Aber vorsicht: wie man den Screenshot entnehmen kann, dann könnt ihr die Einstellung nur verändern wenn die VM powered off ist. Anders sieht es aus wenn ihr eine neue RDM LUN mit neuen SCSI Controller hinzufügt: Hier kann die Einstellung gleich geändert werden -> nicht machen -> die VM verabschiedet sich dann mit einen schönen Bluescreen.

latencyBesonders wichtig ist die Einstellung „perennially reserved“ . Diese Einstellung wird auf jeden Host für jede RDM LUN gesetzt. Ich versuche es mal zu erklären: Da ja die LUN 2 VM’s zugeteilt ist und der Hypervisior nicht weiß das die Clusterressource mit der Disk gerade auf der anderen VM aktiv ist versucht der Host der den passive MSCS Node hat sich alle paar Sekunden die Disk zu nehmen. Geht aber nicht da diese von den anderen Host gelockt ist. Auch die Bootzeit des Hosts verändert sich ins negative. Bei einen MSCS wird euch das nicht wirklich auffallen. In meinen Fall aber werden in einen VMware Cluster 3 MSCS mit je über 15 Disken betrieben, also in Summe ca. 45 RDM LUN’s. Fazit wenn diese Einstellung nicht gesetzt ist: Bootzeit einen Hosts beträgt ca. 3-4 Stunden und die Disklatency könnt ihr dem Screenshot entnehmen.

Wie man die Einstellung setzt ist in folgenden KB Artikel gut erklärt:
http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1016106

Wenn ihr die Einstellung das erste mal setzt so wie bei mir (45 Disken auf je 4 Hosts) wird mal alt bis dies erledigt ist. Beim ersten Mal hilft euch folgendes Script weiter:

Dieses Script liest alle Hosts in den Cluster aus -> sucht nach RDM LUN’s -> verbindet sich auf jeden Host mit root und ändert es über die ESXCli. Dauert ein paar Minuten bis er fertig ist. Danach idealerweiße jeden Host rebooten.  Gestartet wird das Script von der PowerCLI aus mit z.B.  „.\rdm_luns.ps1 vmware_cluster_name“

DRS/HA

Idealerweise auch eine DRS Regel für die Clusternode erstellen damit sie in meinen Fall RZ getrennt laufen.
MSCS Node von HA ausnehmen.

Weitere Einschränkungen

Ein MSCS Clusternode kann nicht im Betrieb migriert werden -> also kein vMotion/SvMotion.
Keine Snpashots
Wenn ein Host offline gehen muss dann muss auch die VM ausgeschalten werden -> Zuerst MSCS Ressourcen moven, dann VM ausschalten und dann kann mit dem Host weitergemacht werden.
Am besten für die MSCS einen eigenen VMware Cluster mit dedizieren Hosts erstellen.