La VM pierde la conexión durante la remoción de snapshots

KB ID:
1681
Producto:
Veeam Backup & Replication
Versión:
All
Publicado:
Últimos modificaciones:
2020-05-11
KB idiomas:
DE | EN | FR

Descripción

Snapshots pueden afectar el rendimiento de máquinas virtuales e incluso pueden llevar a “congelación” durante minutos.

Causa

Veeam no elimina la instantánea en sí, Veeam envía una llamada API a Vmware para que se realice la acción.

El proceso de eliminación del snapshot reduce significativamente el IOPS total suministrado a la VM debido a los bloqueos adicionales en el almacenamiento VMFS debido al incremento de actualizaciones de metadatos y la carga IOP del mismo proceso de remoción de un snapshot. En la mayoría de entornos, si la carga de IOP contra el datastore de destino supera 30-40%, lo que es algo normal para un servidor SQL o Exchange que ejecuta un gran número de transacciones, el proceso de remoción de un snapshot aumentará este valor a 80% o aún más. La mayoría de arrays del almacenamiento sufrirán un gran incremento de latencia una vez que los IOP's lleguen a la marca de más de 80%, lo que sin duda causará un detrimento del rendimiento de las aplicaciones.

Solución

Prueba de aislamiento

La siguiente prueba debe realizarse durante un tiempo en el que la conectividad a la VM no sea sensible.

Para aislar este problema al evento de eliminación de instantáneas específico de VMware, Veeam sugiere la siguiente prueba:

  1. Crear una instantánea de la VM en cuestión.
  2. Dejar la instantánea en la VM durante el tiempo que un trabajo de Veeam corre contra esa VM.
  3. Eliminar la instantánea.
  4. Observar la VM durante la eliminación de instantáneas.

Si durante la realización de la prueba anterior se observan los mismos problemas de conectividad que durante la ejecución de trabajo Veeam, el problema muy probablemente existe dentro del propio entorno VMware. Por favor revise la siguiente lista de pasos de resolución de problemas y problemas conocidos. Si ninguno de los siguientes pasos no le ayuda a resolver el problema, le recomendamos que se ponga en contacto con el Soporte de VMware para el problema de eliminación instantánea.

Pasos comunes para resolver el problema

  • Comprobar si hay instantáneas en la VM mientras no se esté ejecutando ningún trabajo y elimine cualquiera que se encuentre.
  • Buscar instantáneas huérfanas en la VM. (See: http://kb.vmware.com/kb/1005049)
  • Reducir el número de tareas concurrentes que se están ejecutando dentro de Veeam, esto a su vez reducirá el número de tareas instantáneas activas en los almacenes de datos.
  • Mover la VM a un almacén de datos con IOPS más disponibles, o dividir los discos de la VM en varios almacenes de datos para distribuir la carga de manera más uniforme.
  • Si los recursos de CPU de Vms aumentan mucho durante la consolidación de Snapshot, considere aumentar la reserva de CPU para esa VM.
  • Asegúrese de estar en la última su versión actual de vSphere, hipervisores, Vmware Tools y firmware SAN cuando sea aplicable.
  • Mover la VM a un host con más recursos disponibles.
  • Si es posible, cambie la hora del día en que se hace la copia de seguridad para la VM o se replica a una hora en la que ocurra la menor actividad de almacenamiento.
  • Utilizar workingDir para redirigir instantáneas a un almacén de datos diferente al que la VM reside. http://kb.vmware.com/kb/1002929
  • Dishabilitar VMware Tools Sync driver en la VM: http://kb.vmware.com/kb/1009886

 

Problemas conocidos con NFS 3.0 Datastores

Nota: Este número se presentará como varios minutos de bloqueo, una instantánea normal solo tarda unos segundos.

En el momento de escribir este KB había un problema conocido con NFS Datastores y con el modo de transporteVirtual Appliance (HOTADD). El problema está documentado en este artículo de Vmware KB: http://kb.vmware.com/kb/2010953

Veeam aconseja que si este problema se produce, una de las tres cosas se pueden hacer:

1. Usar Direct NFS Mode

Más detalles disponibles aquí:
https://helpcenter.veeam.com/docs/backup/vsphere/direct_nfs_access.html

2. Configurar Veeam Backup & Replication para que use un Proxy desde el mismo host que la VM

Nota: Esta opción sólo está disponible en versiones anteriores a 7.0.0.839

  1. Crear un Proxy en cada host del Cluster VMware
  2. En el servidor donde está instalada Veeam Backup & Replication console abre ‘Registry Editor’
  3. Crear el siguiente valor:
    HKLM\Software\Veeam\Veeam Backup and Replication\
    Type: DWORD
    Name: EnableSameHostHotaddMode
    value: 
    Para este valor hay dos opciones, "1" or "2" Más detalles disponibles aquí:
    • 1- si no hay un Proxy disponible en el mismo host, Veeam Backup & Replication intentará usar un Proxy desde otro host y un modo de transporte disponible, lo que pueda causar bloqueos
    • 2 - si un Proxy desde el mismo host no está disponible, Veeam Backup & Replication usará un proxy disponible en un host diferente, pero lo forzará a usar el modo de transporte de red, de modo que no se produzca ningún bloqueo; esto puede ser preferible cuando el bloqueo.

Nota: Ambos valores 1 or 2 habilitarán el SameHostHotaddMode, que obliga a Veeam B&R a intentar primero usar el Proxy que está en el mismo host que la VM para ser respaldada.

3. Reconfigurar proxies para utilizar el modo de transporte por red.

  1. Editar los proxies listados en [Backup Infrastructure]>[Backups Proxies]
  2. Haga clic en [Choose] botón junto a “Transport mode”
  3. Seleccione la opción de radio para “Network” mode
  4. Haga clic [OK] para cerrar el prompt y luego [Finish] para confirmar el cambio.

Leer más

Los siguientes enlaces se proporcionan para ayudar a entender más sobre el proceso de eliminación de instantáneas dentro de VMware:

http://up2v.nl/2011/05/09/know-the-performance-impact-of-snapshots-used-for-backup/

http://kb.vmware.com/kb/1002836
 

Tenga en cuenta que estamos haciendo cambios que restringirán el acceso a las actualizaciones de productos a los usuarios que no dispongan de un contrato en vigor.

OK

Valore la calidad de este artículo de la base de datos de conocimiento (KB): 
3.8 out of 5 based on 76 ratings

¿No pudo encontrar lo que está buscando?

A continuación puede enviar una idea para un nuevo artículo de la base de datos de conocimiento.

¿Has detectado un error en esta página?::

Por favor, seleccione un error en esta página con el ratón y pulse Ctrl + Enter para reportar este error a nosotros. ¡Muchas gracias!

Spelling error in text:

Enviar