Qué es un DRP
Un Plan de Recuperación ante Desastres (DRP, por sus siglas en inglés) es un documento operativo que explica cómo volver a estar en línea cuando algo falla a lo grande. No es solo tener backups: es saber exactamente quién hace qué, en qué orden, con qué herramientas y en qué plazo. Un hosting profesional que no tiene DRP simplemente apaga la luz cuando ocurre un incidente serio y espera suerte.
Escenarios típicos a cubrir
Un buen DRP no se limita a "se cayó el servidor". Debe contemplar al menos estos escenarios:
- Pérdida de disco: falla un SSD, el RAID se degrada, el volumen del VPS queda inaccesible.
- Data center caído: corte de energía, problemas de red en la región, incendio, desastre natural.
- Ransomware: un atacante cifra los datos del servidor y exige pago.
- Error humano: un
DROP TABLEen producción, unrm -rfen la raíz, una migración mal hecha. - Compromiso de cuenta: alguien roba credenciales y borra recursos del panel de control.
RPO y RTO
Son dos métricas que debes fijar antes de pensar en herramientas:
- RPO (Recovery Point Objective): cuántos datos toleras perder medidos en tiempo. Si haces backup cada 24 horas, tu RPO real es 24 h; si replicas cada 15 minutos, tu RPO es 15 minutos.
- RTO (Recovery Time Objective): cuánto tiempo puedes estar caído antes de que el daño sea inaceptable. Un ecommerce puede tener un RTO de 1 h; un blog personal puede aceptar 24 h.
El RPO define cuán frecuentes deben ser los respaldos y la replicación. El RTO define si necesitas automatización, servidor en caliente o basta con un restore manual.
Qué debe documentar el DRP
- Inventario: lista de servidores, servicios, dominios, paneles, proveedores y credenciales (en un gestor seguro).
- Dependencias: qué servicio depende de qué (DNS, correo, base de datos, CDN).
- Procedimientos paso a paso: cómo reinstalar cada servidor, cómo restaurar cada backup, cómo cambiar DNS, cómo levantar un servidor espejo.
- Responsables: quién declara el desastre, quién ejecuta la restauración, quién comunica a los clientes.
- Contactos: soporte del proveedor de hosting, del registrador de dominios, del servicio de correo y de los clientes clave.
Probar las restauraciones
Un DRP no probado es ficción. Al menos una vez al trimestre (y siempre después de un cambio importante) se debe:
- Tomar un backup real y restaurarlo en un entorno paralelo.
- Verificar que la aplicación arranca, que la base de datos está completa, que los correos funcionan y que los usuarios pueden entrar.
- Medir el tiempo real de restauración y compararlo contra el RTO comprometido.
- Actualizar el documento con cualquier paso que haya faltado.
Comunicación durante el incidente
Un DRP moderno incluye también cómo comunicar. Preparar de antemano una plantilla de estado, una página de status y una lista de distribución evita que durante el incidente te dediques a improvisar mensajes mientras el equipo técnico ya está presionado. Tu reputación depende tanto de recuperar los datos como de mostrar control del problema mientras lo resuelves.