Tiempos de espera VSS en Exchange

KB ID: 1680
Productos: Veeam Backup & Replication
Versión: 6.x
Publicado:
Últimos modificaciones: 2013-10-31
KB idiomas: DE | EN | FR

Descripción

Unfreeze error:[Backup job failed]
Cannot create  shadow copy of the volumes containing writer’s data
A VSS critical writer has failed. Writer name: [Microsoft Exchange Writer]. Class ID: [{76fe1ac4-15f7-4bcd-987e-8e1acb462fb7}]. Instance ID: [{0db23250-4d1e-42c1-8d14-2be32f448184}]. Writer's state: [VSS_WS_FAILED_AT_FREEZE]. Error code: [0x800423f2].]

Al iniciar sesión en el servidor de Exchange una vez que haya fallado el backup, pasando a la interfaz de línea de comando y escribiendo vssadmin list writers verá el estado actual de todos los editores de VSS.  Normalmente verá que el editor de Exchange ha fallado debido a un error de tiempo de espera (código de error 9).

Causa

Infraestructura
 
Aquí se explica cómo funciona el proceso de backup:
2.1. Se inicia la “congelación” de las VM mediante VSS, hay dos formas de hacerlo: a través de admin share(b) o con VIX(a).
a) Nos conectamos al vCenter con VIX(tcp 443,902), el vCenter pasa nuestro agente hacia ESX/ESXi, ESX/ESXi pasa los datos dentro de la VM y nuestro agente se ejecuta a través de VMware Tools.
b) Nos conectamos a Admin Share y enviamos nuestro agente a través del protocolo SMBFS/CIFS; al instalar el agente iniciamos la “congelación” de la VM vía VSS. Cuando la VM sea “congelada” empieza la cuenta atrás; el editor de VSS de Exchange no puede estar activo durante más de 20 segundos: esto es el comportamiento “por diseño” de Microsoft:
http://msdn.microsoft.com/en-us/library ... 15(v=vs.85)
2.2. Vamos a vSphere y creamos un snapshot de VMware de la VM
2.3. Al crear el snapshot de VMware volvemos a la VM y la “descongelamos”
2.4. Luego se transfieren los datos y se remueve el snapshot.
 
De esta forma, entre el paso 2.1 (cuando comienza la cuenta atrás) y el paso 2.3 tenemos sólo 20 segundos. Si Veeam no “congela” la VM de forma adecuada, el subsistema de VSS Windows lo hace por sí solo. Por lo tanto se obtiene el error al “descongelar”.
 
La creación de snapshot de la VM debería tardar sólo un par de segundos. Si dura más, la ventana de 20 segundos no será suficiente para realizar todo el conjunto de operaciones necesarias.
 
Además, hay que tener en cuenta que las operaciones a través de VIX son más lentas que se realizan a través de admin share.
Las operaciones a través de servidor ESX/ESXi son normalmente más rápidas que las mismas a través de vCenter.

Solución

Éste es un problema de infraestructura, por tanto puede ser difícil localizarla.  He aquí una lista completa de soluciones que han utilizado los clientes para eliminar este problema.
 

  • Primero asegúrese de que es posible crear un Windows Backup de la VM con VSS. Esto va a confirmar que el problema no está específicamente relacionado con VSS en sí mismo, pero sí con una combinación de VSS con la tecnología de snapshot de VMware.
  • Asegúrese de que no hay otros agentes de backup de otros proveedores en el servidor del que se hace la copia, y si es así, desinstálelos.  Si necesita hacer operaciones de VSS en el SO guest, debería hacerlas con sólo un producto de backup. Tenga en cuenta que Veeam utiliza Microsoft VSS, mientras otros proveedores de software pueden usar sus propios proveedores o editores de VSS, pues que otras soluciones de backup hagan copias correctamente, no es una comparación válida.
  • Reinicie el servidor Exchange
  • Compruebe que el host ESX(i) tiene suficientes recursos
  • Desactive VSS para la VM (con sólo que no sea necesario)
  • El snapshot de VMware se crea durante más de 20 segundos (tiempo de espera del editor de VSS de Exchange)
  • La “congelación” de Exchange supone un consumo de I/O del datastore muy intenso, por eso puede ser necesario reducir el período de backup y/o modificar el datastore de Exchange
  • Puede ser necesario reiniciar COM+ Event System Service. Causa original es desconocida  En algunos casos los clientes programan un script que reinicia este servicio antes de hacer backup.
  • Por causa de latencia entre vCenter y hosts a veces será conveniente hacer backup a través de host directamente para realizar backups con VSS correctamente, mientras haciéndolo a través de vCenter puede causar problemas de “congelamiento”.
  • Si Veeam no tiene comunicación directa de red con Exchange, realice una prueba: ponga Veeam en una red que tenga conexión hacia Exchange y vea si se resuelve el problema.  Sin embargo, la comunicación directa de red no es necesaria si hay problemas subyacentes de VIX; en este caso intentamos usar IP para comunicarse y en algunos casos esto no funciona adecuadamente por la arquitectura de red
  • En el caso de que está usando el "modo sin conexión" para VSS (por ejemplo si existe un firewall y por ello contamos con VIX API al comunicarse) es sumamente importante cumplir al menos una de las condiciones siguientes:
1. La cuenta utilizada para Application Aware Processing debe ser la de administrador local ("incorporada") o bien la de administrador de dominio, también "incorporada" (por ejemplo debe tener un SID que termine en 500), otras cuentas de administrador local o de dominio no sirven.

--O--

2. UAC debe estar desactivado en las VMs guest
Asegúrese de que no hay ningún snapshot en ejecución en la VM de Exchange que pudiera causar latencia de I/O de almacenamiento adicional que no sea necesario.
El servidor de Exchange puede necesitar recursos adicionales si se ve agravado durante la “descongelación”.

3 / 5 (36 votos)

¿Has detectado un error en esta página?::

Por favor, seleccione un error en esta página con el ratón y pulse Ctrl + Enter para reportar este error a nosotros. ¡Muchas gracias!

Orphus system