VSS Timeouts in Exchange

KB ID: 1680
Produkte: Veeam Backup & Replication
Version: 6.x
Veröffentlicht:
Aktualisert: 2013-11-05
KB Sprachen: EN | ES | FR

Beschreibung

Unfreeze error:[Backup job failed]
Cannot create  shadow copy of the volumes containing writer’s data
A VSS critical writer has failed. Writer name: [Microsoft Exchange Writer]. Class ID: [{76fe1ac4-15f7-4bcd-987e-8e1acb462fb7}]. Instance ID: [{0db23250-4d1e-42c1-8d14-2be32f448184}]. Writer's state: [VSS_WS_FAILED_AT_FREEZE]. Error code: [0x800423f2].]

Wenn Sie sich nach einem fehlgeschlagenen Backup am Exchange-Server anmelden und in der Eingabeaufforderung den Befehl „vssadmin list writers“ eingeben, werden alle Writer mit ihrem aktuellen Status angezeigt. Für gewöhnlich sehen Sie, dass ein Exchange Writer aufgrund eines Timeout-Fehlers abgebrochen wurde (Fehlercode 9).

Ursache

Infrastruktur

Backup-Prozesse funktionieren wie folgt:
2.1. Initiierung der VSS-Unterbrechung der VM – hierfür gibt es zwei Möglichkeiten: a) VIX und b) Admin Share.
a) Wir stellen eine Verbindung mit VC über VIX (TCP 443,902) her; VC übergibt Daten über unseren Agenten an ESX/ESXi; ESX/ESXi übergibt Daten innerhalb der VM; und unser Agent wird mithilfe der VMware-Tools ausgeführt.
b) Wir stellen eine Verbindung mit dem Admin Share her und übergeben unseren Agenten via SMBFS/CIFS-Protokoll; nach der Implementierung unseres Agenten initiieren wir die VSS-Unterbrechung der VM; ab dem Zeitpunkt der Unterbrechung beginnt der Countdown; Exchange VSS Writer kann maximal 20 Sekunden lang angehalten werden (dies ist von Microsoft so vorgegeben).
http://msdn.microsoft.com/en-us/library ... 15(v=vs.85)
2.2. Wir öffnen vSphere und erstellen einen VMware-Snapshot der VM.
2.3. Nach der Erstellung des VMware-Snapshots wechseln wir zurück zur VM und setzen deren Ausführung fort.
2.4. Die Datenübertragung wird fortgesetzt und der Snapshot wird festgeschrieben.

Zwischen Schritt 2.1 (Beginn des Countdowns) und Schritt 2.3 dürfen also maximal 20 Sekunden vergehen. Wenn Veeam die VM nicht innerhalb der Frist unterbricht, übernimmt das Windows-VSS-Subsystem diese Aufgabe selbst. Folglich wird Ihnen der oben aufgeführte Unfreeze-Fehler angezeigt.

Die Snapshot-Erstellung für die VM sollte nur wenige Sekunden dauern, andernfalls können Sie den Vorgang nicht rechtzeitig innerhalb des 20-Sekunden-Zeitfensters abschließen.

Beachten Sie bitte auch, dass Vorgänge via VIX länger dauern als Vorgänge via Admin Shares.
Außerdem werden Prozesse über den ESX/ESXi-Server normalerweise schneller (ausgeführt als über den VC-Server.

Lösung

Die Ursache dieses Problems ist in der Infrastruktur zu suchen und lässt sich häufig nur schwierig eingrenzen. Die folgende umfassende Liste enthält Lösungen, mit denen Kunden das Problem in der Vergangenheit beheben konnten:


  • Stellen Sie zunächst sicher, dass Sie ein Windows-Backup der VM mithilfe von VSS erstellen können.  Auf diese Weise können Sie nachweisen, dass es sich nicht um einen rein VSS-bezogenen Fehler handelt, sondern um ein Problem bei der Kombination von VSS mit VMware-Snapshots.
  • Überprüfen Sie, ob es Agenten anderer Backup-Anbieter auf dem Server gibt, für den Sie das Backup erstellen möchten. Falls ja, deinstallieren Sie diese Agenten. Wenn Sie VSS-Vorgänge auf einem Gastbetriebssystem ausführen müssen, sollte dabei nur ein einziges Backup-Produkt zum Einsatz kommen. Veeam nutzt Microsoft VSS – andere Softwareanbieter nutzen aber möglicherweise eigene VSS-Anbieter/VSS-Writer. Wenn diese anderen Produkte erfolgreich Backups erstellen, lässt dies jedoch noch keine Rückschlüsse auf Veeam zu.
  • Führen Sie einen Neustart des Exchange-Servers durch.
  • Der ESX(i)-Host verfügt nicht über genügend Ressourcen.
  • Deaktivieren Sie VSS für die betroffene VM (vorausgesetzt natürlich, dass das Programm nicht benötigt wird).
  • Die Erstellung des VMware-Snapshots dauert länger als 20 Sekunden (fest programmiertes Timeout von Exchange VSS Writer).
  • Eine Exchange-Unterbrechung resultiert in einer zu hohen E/A-Belastung für den Storage und beeinträchtigt die Backup-Dauer. Möglicherweise muss der Exchange-Datenspeicher modifiziert werden.
  • COM+ Event System Service muss möglicherweise neugestartet werden. Die Hauptursache ist unbekannt. Einige Kunden haben mithilfe eines Skriptes dafür gesorgt, dass dieser Dienst vor dem Backup neugestartet wird.
  • Die Latenz zwischen VC und Hosts kann dazu führen, dass beim direkten Sichern über den Host erfolgreiche VSS-Backups erstellt werden, das System jedoch beim Sichern über VC einen Fehler ausgibt.
  • Falls zwischen Veeam und Exchange keine direkte Netzwerkkommunikation stattfindet, verschieben Sie Veeam testweise auf ein Netzwerk, das problemlos mit Exchange kommunizieren kann, und prüfen Sie, ob das Problem dadurch gelöst wird. Direkte Netzwerkkommunikation ist zwar nicht zwingend erforderlich, aber im Falle von Problemen mit VIX versuchen wir, via IP zu kommunizieren, was jedoch manchmal aufgrund der Netzwerkarchitektur nicht ordnungsgemäß funktioniert.
  • Wenn Sie „connectionless mode“ für VSS verwenden möchten (d. h., es ist eine Firewall vorhanden und die Kommunikation erfolgt somit über die VIX API), muss MINDESTENS EINE der folgenden Bedingungen erfüllt sein:

    1. Das zum Application Aware Processing verwendete Benutzerkonto MUSS entweder das „integrierte“ lokale Administratorkonto oder das „integrierte“ Domänenadministratorkonto sein (d. h., das Konto muss eine bekannte SID haben, die auf -500 endet). Andere lokale Konten oder Domänenadministratorkonten sind hier nicht nutzbar.

    --ODER--

    2. UAC muss auf der Gast-VM deaktiviert sein.
  • Achten Sie darauf, dass auf der Exchange-VM kein Snapshot ausgeführt wird, der zusätzliche Storage-E/A verursacht, die nicht zwingend erforderlich ist.
  • Der Exchange-Server benötigt unter Umständen zusätzliche Ressourcen, wenn er beim Fortsetzen der VM stark belastet wird.

3 / 5 (36 Stimmen)

Einen Fehler gefunden?:

Markieren Sie mit Ihrer Maus einen Tipp- oder Rechtschreibfehler auf dieser Seite und drücken Sie CTRL+Enter, um uns den Fehler mitzuteilen.

Orphus system