Desmitificando los Objetivos de Recuperación

El tiempo de inactividad no es una opción para las organizaciones modernas que deben satisfacer las necesidades y expectativas de sus clientes. Se pueden producir diferentes tipos de incidentes que tengan un impacto en los ingresos de su negocio o incluso en su existencia. Ya sea un ataque de ransomware, un corte de energía, una inundación o simplemente errores humanos, estos eventos son impredecibles, y lo mejor que puede hacer es ESTAR PREPARADO.

Estar preparado significa que debe tener un plan sólido de continuidad comercial y recuperación ante desastres (BCDR, por sus siglas en inglés). Uno que haya sido probado y pueda ponerse en marcha sin problemas.

Dos de los parámetros importantes que definen un plan BCDR son el Objetivo del Punto de Recuperación (RPO, por sus siglas en inglés) y el Objetivo del Tiempo de Recuperación (RTO, por sus siglas en inglés). Para quienes no están familiarizados con estos términos, permítanme darles una breve descripción:

  • RPO limita la distancia de retroceso en el tiempo, y define la cantidad máxima permitida de datos perdidos medidos en el tiempo, desde la ocurrencia de una falla, hasta la última de backup válida.
  • RTO está relacionado con el tiempo de inactividad, y representa cuánto se tarda la restauración desde el incidente hasta que las operaciones normales estén disponibles para los usuarios.

Demystifying Recovery Objectives

Si bien RPO y RTO pueden parecer similares, sirven para diferentes propósitos y, en un mundo ideal, sus valores serían tan cercanos a cero como sea posible. Sin embargo, de vuelta en nuestro mundo, el costo cero para RPO y RTO sería extremadamente costoso y podría no valer la pena el esfuerzo.

Echemos un vistazo más detallado a los objetivos de recuperación. RPO es la cantidad de datos que puede perder antes de que afecte las operaciones comerciales. Por ejemplo, para un sistema bancario, una hora de pérdida de datos puede ser catastrófica, ya que operan transacciones en vivo. A nivel personal, también puede pensar en RPO como el momento en que guardó por última vez un documento en el que está trabajando. En caso de que su sistema falle y pierda su progreso, ¿cuánto de su trabajo está dispuesto a perder antes de que le afecte?

Por otro lado, RTO es el marco de tiempo dentro del cual la aplicación y los sistemas deben ser restaurados después de una interrupción. Es una buena práctica medir el RTO a partir del momento en que ocurre la interrupción, en lugar del momento en que el equipo de TI comienza a solucionar el problema. Este es un enfoque más realista, ya que representa el punto exacto en el que los usuarios comienzan a verse afectados.

Cómo definir los valores de RTO y RPO para sus aplicaciones

La verdad es que no existe una solución única para un plan de continuidad del negocio y sus métricas. Las empresas son diferentes, tienen distintas necesidades y, por lo tanto, tienen diferentes requisitos para sus objetivos de recuperación. Sin embargo, una práctica común es dividir aplicaciones y servicios en diferentes niveles, así como establecer los valores de tiempo de recuperación y objetivo (RTPO, por sus siglas en inglés) de acuerdo con los acuerdos de niveles de servicio (SLA, por sus siglas en inglés), con los que se compromete la organización.

La clasificación de protección de datos es importante para determinar cómo almacenar, acceder, proteger, recuperar y actualizar datos e información de manera más eficiente en función de sus criterios específicos. Es de suma importancia analizar sus aplicaciones y determinar cuáles de ellas están impulsando su negocio, generando ingresos y siendo imprescindibles para mantenerse operativo. Este proceso, que es esencial para un buen plan de continuidad comercial, se denomina análisis de impacto del negocio (BIA, por sus siglas en inglés), y establece protocolos y acciones para enfrentar un desastre.

Por ejemplo, puede usar un modelo de tres niveles para diseñar su plan de continuidad del negocio:

  • Nivel 1: Aplicaciones esenciales que requieren un RTPO de menos de 15 minutos.
  • Nivel 2: Aplicaciones esenciales para un negocio que requieren RTO de 2 horas y RPO de 4 horas.
  • Nivel 3: Aplicaciones no esenciales que requieren RTO de 4 horas y RPO de 24 horas.

Es importante tener en cuenta que las aplicaciones esenciales, para un negocio y las no esenciales, varían de una industria a otra, y cada organización define estos niveles en función de sus operaciones y requisitos.

Ahora que ha clasificado sus aplicaciones y servicios y sabe cuál será el impacto en caso de incidentes específicos, es hora de encontrar una solución que lo ayude a proteger los datos y las operaciones de su empresa. Veeam Availability Platform es un conjunto completo de herramientas diseñadas para lograr objetivos de recuperación estrictos para cargas de trabajo virtuales, físicas y en la nube.

¿Cómo funcionan RTO y RPO en la práctica?

Recuperación rápida de elementos desde cualquier aplicación

Un representante de ventas eliminó un correo electrónico que debe enviarse a un cliente lo antes posible. Microsoft Exchange es un ejemplo de aplicaciones de Nivel 2. Dado que el administrador de TI programa tareas de backup durante todo el día, la compañía definitivamente puede lograr el RPO de 1 hora. Con Veeam Explorer para Microsoft Exchange, que es parte de todas las versiones de Veeam Backup & Replication, es muy fácil recuperar un artículo individual de correo electrónico en cuestión de minutos, o incluso segundos, ahorrando tiempo y recursos en la práctica o restaurando una VM completa del servidor de aplicaciones.

Demystifying Recovery Objectives

Recuperación instantánea de un servidor virtualizado completo directamente desde una backup

Imaginemos un banco que opera varios cajeros automáticos. El sistema ATM es esencial para el negocio, para las operaciones del banco (Nivel 2), pero si se bloquea por unas pocas horas, tendrá un impacto en las transacciones bancarias, no en la integridad del banco. Con el uso de Veeam Backup & Replication y la función Instant VM Recovery, usted puede iniciar de inmediato el servidor virtualizado del ATM desde el archivo backup de Veeam, deduplicado y comprimido. ¡Esto dará como resultado un RTO de solo unos minutos! Además, usando las funciones de migración de hipervisor y Veeam Quick Migration, puede migrar fácilmente la VM en ejecución desde el almacén de datos de backup al almacén de datos de producción, para completar el proceso de recuperación.

Demystifying Recovery Objectives

Failover de todo el sitio

Los trabajadores de mantenimiento provocaron una falla eléctrica en uno de sus centros de datos, lo que provocó un error en todo el sitio y la pérdida de acceso a todas sus aplicaciones de Nivel-1. Supongamos que usa Veeam para replicar todas sus VMs esenciales fuera del sitio dos veces al día. Esto le permite alcanzar fácilmente el RPO definido en minutos. Desde una perspectiva de RTO, Veeam le permite recuperarse fácilmente en caso de incidentes importantes con varias funciones incorporadas: failover con un solo clic, failover asistida, Re-IP para hacer coincidir la red en el sitio de DR, y verdadera recuperación de desastres basada en la nube.

Demystifying Recovery Objectives

Protección de extremos

Al pasar de su infraestructura virtual al mundo físico, Veeam también ofrece soluciones de backup y recuperación para sus computadoras portátiles o de escritorio. Con Veeam Agent para Microsoft Windows, puede restaurar archivos desde su Medio de Recuperación a su computadora basada en Windows, o incluso alimentar la imagen de backup de su PC a una máquina virtual, para lograr bajos RPO.

Demystifying Recovery Objectives

Además, con Veeam Agent para Linux, puede proteger sus cargas de trabajo de Linux, si se ejecutan en las instalaciones o en la nube pública.

Demystifying Recovery Objectives

Conclusión

Nadie puede predecir un desastre; sin embargo, puede actuar de manera organizada siguiendo el plan de continuidad de su negocio cuando enfrenta un incidente de este tipo. Los valores de RPO y RTO pueden variar según las diferentes compañías, pero en todo momento supondrán un compromiso entre las necesidades comerciales de disponibilidad y las inversiones requeridas en TI. Su estimación debe ser el resultado de una deliberación entre el negocio de su organización y los expertos en TI. Pero lo que va más allá de cualquier deliberación es la implementación de una solución de Disponibilidad confiable para cargas de trabajo virtuales, físicas y en la nube, para garantizar operaciones Always-On para su negocio.

Leer también

Cristian-Antonio Puricica
Cristian-Antonio Puricica
Cristian-Antonio es Especialista de Veeam certificado en diseño de base de datos de Oracle y programación con SQL. Su experiencia en Desarrollo Web y TI sumada a su pasión por las nuevas tecnologías han impulsado su interés en virtualización y computación en la nube. Cristian-Antonio es entusiasta de compartir su experiencia y sus nuevos descubrimientos con la comunidad de TI. Siga a Cristian-Antonio en LinkedIn.
More about author
Rate the quality of this Article:
4.71 out of 5 based on 7 votes
Please wait...
V10

Better Backup

Faster. Stronger. Smarter

Learn more