Hjälp, klustret svarar inte!

Det är knappast en trevlig känsla när man inser att SCOM larmar, VMM säger att den inte har kontakt med Filservern, samt när du loggar in på SOFS klusternoderna, eller rättare sagt, från din administrationsmaskin startar Failover Cluster Manager och inser att du inte ens kan koppla upp dig mot klustret.
Följande har nu hänt mig ett par gånger hos lite olika kunder. Och lösningen är som tur är hyffsat enkel också.

  1. Ha lite is i magen, dina VM:s snurrar, så diskarna är uppe. Andas ut och starta PowerShell.
  2. Kontrollera status för ditt kluster ”Get-Cluster samt Get-ClusterNode” är bra verktyg för det.
  3. Troligen visar den nu att båda är i state ”UP”
  4. Pausa ena klusternoden, Suspend-ClusterNode ”ServerNamn” -DrainRoles
  5. På den servern som du nu stoppade, så startar du om klustertjänsten ”Restart-Service ClusSvc”
  6. Starta klustret igen med ”Resume-ClusterNode ”ServerNamn”
  7. Upprepa sedan proceduren med den andra noden.

Nu kommer du att upptäcka att du kan starta GUI verktygen mot Klustret igen. När läget är under kontroll, så kan det vara läge för lite standard MS felsökning, dvs pausa en av noderna och starta om dom vi ordning.
Varför inträffar detta då, jag har märkt detta vid hårdvaru/nätverksproblem. Men det kan mycket väl vara andra orsaker som att klusternoderna har olika patchnivåer osv.