945 261 858

Conceptos de copias y recuperación de datos (4/6)

Opciones

Dispositivos de copia de seguridad

Las copias de seguridad pueden realizarse en almacenamiento en disco – el mismo medio de almacenamiento que contiene la mayor parte de los datos originales. El almacenamiento en disco es el más rápido, pero más caro, medio utilizado para copias de seguridad.

Tenga en cuenta, sin embargo, que la velocidad del dispositivo no es el factor más importante en la velocidad total de una copia de seguridad. El tiempo de comunicación entre la fuente de datos originales y el destino de la copia de seguridad tiene un efecto mucho mayor en la velocidad de copia de seguridad en general.

La cinta es el soporte de destino de copia de seguridad más utilizado para las empresas. El bajo costo de las cintas es el principal factor de la popularidad de esta opción. A pesar de que se utiliza ampliamente y se considera bastante fiable, soluciones de cinta difieren en términos de coste, fiabilidad, velocidad de ciclo de trabajo y de compatibilidad.  La cinta tiene la ventaja de ser ligera y compacta, por lo que es fácil de transportar físicamente.

Dispositivos magnetoópticos de almacenamiento se utilizan sobre todo en las configuraciones de cajas de discos para el archivado de datos y algunas soluciones de copia de seguridad. Aunque los costos de almacenamiento son mucho más bajos que el almacenamiento en disco, la velocidad y el límite de almacenamiento por unidad limita esta opción para su uso generalizado.

CDs, DVDs grabables y unidades USB se utilizan principalmente en las configuraciones de usuario de ordenador portátil y el hogar. Los costos de los dispositivos son muy bajos, pero también lo son la fiabilidad, velocidad y escalabilidad de la solución.

Localización de las copias de seguridad

Dispositivos de copia de seguridad locales y remotos

A lo largo de la historia de la informática, un servidor ha copiado sus datos a una unidad de cinta físicamente conectada. A continuación, la cinta se retira, se etiqueta con el nombre del servidor y la fecha, y luego se lleva a un almacén seguro y climatizado. Si un archivo o todo el sistema necesita ser restaurado, el administrador llama o va a ese almacén y pide la cinta correcta (o cintas). Entonces se lleva la cinta correcta de nuevo al centro de datos, donde el administrador del sistema la carga en la unidad de cinta del servidor y realiza la restauración.

En este modelo, las partes «informáticas» de realizar la copia de seguridad y de realizar la restauración finales son relativamente rápidas. La logística de almacenaje, sin embargo, lleva mucho más tiempo.

En la práctica, la gran mayoría de las solicitudes de restauración son de usuarios que sólo han cometido un error que no puede recuperarse. Para cumplir con dichas solicitudes por lo general se necesitan los datos de la última copia de seguridad. Así, los administradores de TI inteligentes que utilizan cintas de copia de seguridad pronto aprenden a mantener las cintas recientes en su lugar de trabajo por uno o dos días.

Estos Administradores de TI realizan una doble copia de seguridad en cinta, cada día, con el fin de tener una copia de fácil acceso y una copia de seguridad enviada al almacén fuera del sitio. Por supuesto, lo que hace la copia extra, es un costo laboral adicional.

Copias de seguridad en red

Como las redes de área local se convirtieron cada vez, en más rápidas y más baratas, y el número de servidores crecieron dramáticamente, se vio que era razonable utilizar dispositivos de copia de seguridad que no estaban conectados directamente a cada servidor. Bibliotecas de cintas de gran tamaño pueden escribir varias cintas a la vez, o una unidad de cinta más pequeña compartida pueden recibir datos de varios servidores en turnos.

En una pequeña empresa con una red local rápida, una solución común es que los servidores que sostienen pequeñas cantidades de datos, esos datos los descarguen a un servidor grande con espacio extra en el disco. Ese servidor grande, a veces llamado explícitamente el «servidor de copia de seguridad» es al que se le realiza la copia de seguridad en cinta.

Ventana de Backup

Un administrador de copia de seguridad, mediante esta técnica, debe tener en cuenta el ancho de banda al seleccionar la ventana de copia de seguridad. La última cosa que quiere es ver la tarjeta de red de un servidor (NIC) congestionada con grandes transferencias de archivos durante las horas de más trabajo. El administrador también debe recordar que una tarjeta de red, rara vez gestiona datos más rápidamente que  una unidad de cinta conectada en local al servidor. Para la ventana de copia de seguridad puede ser necesario más tiempo de lo necesario para un dispositivo conectado al servidor.

Si se necesita más tiempo para las copias de seguridad de las que la empresa se puede permitir, se debe considerar una serie de posibilidades. ¿Es posible que el problema sea de congestión en la red? Si es así, una tarejta de red adicional dedicada a las copias de seguridad podría ser la solución. De hecho, no es raro ver a una red separada construida sólo para gestionar las copias de seguridad y las restauraciones.

¿Es el ancho de banda de E / S a los discos una restricción? Más discos con archivos asignados estratégicamente entre ellos, podría ser la respuesta. La reducción del número de copias de seguridad «completa» (véase la sección siguiente), también puede ser razonable. Si todo lo demás falla, puede ser perfectamente razonable volver a utilizar un dispositivo de copia de seguridad conectado localmente.

Rendimiento de las restauraciones

Las soluciones de copia de seguridad en red también tienen efectos en el tiempo que se tarda en realizar las restauraciones. Si la copia de seguridad más reciente todavía está en un servidor de copia de seguridad, no habrá necesidad de esperar a una cinta para ser recuperado y cargado. Para una gran restauración, sin embargo, el ancho de banda de red es una nueva restricción. Si el servidor esta funcionando, puede ser mejor retrasar una gran restauración hasta que la red del sistema esté relativamente inactiva.

Dada la velocidad de las redes de hoy en día, la gran mayoría de empresas utilizan muy pocos dispositivos de copia de seguridad directamente conectados a los servidores, reservando para los «servidores de copias de seguridad» grandes cantidades de almacenamiento.

Copias de seguridad en una WAN o en la Nube

Con el aumento de ancho de banda de Internet , se hace factible considerar el dirigir las copias de seguridad a un equipo que está lejos del servidor donde residen los datos. Ese equipo podría estar ubicado en otro centro de datos gestionado por la misma empresa. O bien, el equipo de copia de seguridad puede ser alojado y gestionado por un proveedor que ofrece servicios de copia de seguridad y restauración «basada en la nube».

La ventaja inmediata de este enfoque, es la seguridad de la distancia . Un incendio , fuga de agua o desastre que afecte a un centro de datos probablemente no dañará un centro de datos que se encuentra a pocos kilómetros de distancia . Un huracán , un terremoto o tsunami que afecta a un centro de datos en una región,  probablemente no va a afectar a un centro de datos a miles de kilómetros de distancia.

La ventaja más sorprendente de este sistema es que los tiempos de restauración son más cortos. Los tiempos de recuperación tradicionales han estado dominados por el tiempo que se necesita para tener una persona que entregue una cinta al lugar de recuperación. Un RTO realista tenía que ser largo para tener en cuenta ese tiempo de traslado . Con el almacenamiento en una WAN o en la Nube, una restauración puede comenzar rápidamente porque la copia de seguridad se almacena en línea.

( Las cintas todavía se podrían utilizar en esta situación, para mantener los costos bajos  de almacenamiento de copias de seguridad antiguas, o incluso poder tener una tercera copia de algunas copias de seguridad.)

No todos los tiempos de restauración son más rápidos. El ancho de banda de Internet sigue siendo caro para la mayoría de las empresas , y por lo tanto limitada a un nivel que la empresa necesite para su trabajo diario en circunstancias normales. Una gran restauración podría colapsar el ancho de banda disponible y aún llevaría mucho más tiempo que el RTO.

Los buenos proveedores de copia de seguridad en la Nube tienen formas de abordar este problema , pero las leyes de la física que limitan la velocidad de transferencia de datos no pueden ser violados .

Soluciones de copias de seguridad híbridas

En los últimos años, algunas empresas proveedoras de copias de seguridad en Internet  ofrecen soluciones híbridas o soluciones «cloud-connected», que ofrecen la velocidad de restauración de copias de seguridad locales y la seguridad de las copias de seguridad de Internet.

Estas soluciones a menudo hacen uso de una copia de seguridad a nivel local en un servidor o «appliance» – este servidor proporciona el software para realizar tanto el almacenamiento de copia de seguridad local como transferir esas copias de seguridad sobre un enlace WAN o Internet.

Técnicas de copia de seguridadFallo del Backup

Cuando se selecciona un conjunto de datos para realizar su copia de seguridad, debemos decidir el tipo de copia de seguridad que vamos a utilizar y valorar los cambios que esos datos tendrán a largo del tiempo. Esas decisiones afectarán a la facilidad para realizar más tarde una restauración de datos.

Una copia de seguridad completa es una copia completa de todos los datos a copiar  en un punto particular en el tiempo. (La recopilación de datos podría incluir todos los datos de usuario y del sistema operativo en un servidor, por ejemplo, o todos los datos en los discos de un servidor determinado.) Una copia de seguridad completa permite en un proceso de un solo paso, la restauración completa de todos o de cualquiera de los datos incluido en la copia de seguridad.

La desventaja de la copia de seguridad completa es que hacen copias de todos los datos, aunque la gran mayoría de ellos no haya cambiado desde la última copia de seguridad. Cada copia de seguridad completa puede ser muy lento y el uso de los discos del servidor o cintas y el ancho de banda utilizado muy grande.

Las copias de seguridad diferenciales abordan parcialmente este problema mediante la programación de copias de seguridad completas con una menor frecuencia. Una copia de seguridad diferencial hace una copia de seguridad sólo de los datos o los archivos que han cambiado desde la última copia de seguridad completa . Como la mayoría de los datos almacenados en los servidores no cambia , una copia de seguridad diferencial contiene muchos menos archivos que una copia de seguridad completa.

Los sistemas de copia de seguridad son capaces de detectar cambios en un archivo mediante el aprovechamiento de una característica del sistema de archivos llamado el bit de archivo. Cada vez que el sistema de ficheros , escribe un cambio en un bloque en un archivo, se activa el bit de archivo para ese bloque . Los sistemas de copia de seguridad tradicionales buscan los bloques con que se convirtió en el bit de archivo . El sistema de copia de seguridad reconoce que un archivo que contiene una o más de los bloques modificados es un archivo modificado, y que la versión modificada del archivo debe ser respaldado . Después de que la nueva versión se ha copiado , el sistema de copia de seguridad, desactiva los bits de archivo de todos los bloques cambiados del archivo. Los bits se pueden «encender» de nuevo en el sistema de ficheros si los bloques de esos ficheros cambian de nuevo.

La restauración de una colección de datos completo en un sistema que utiliza copias de seguridad diferenciales se convierte ahora en un proceso de dos pasos. En primer lugar, la copia de seguridad completa adecuada debe ser restaurada, y después la copia de seguridad diferencial apropiada tendrá que restaurarse para recuperar la última versión de los bloques de esos ficheros . Por ejemplo , si un servidor se ha bloqueado , el administrador de copia de seguridad podría restaurar la última copia de seguridad completa y , a continuación, restaurar los datos de la diferencial más reciente, que sobrescribe todos los datos que se han cambiado entre el momento de realizar la copia de seguridad completa se y el momento en que se hizo la diferencial. Estos dos pasos de restauración y el tiempo adicional empleado en restaurar los ficheros al momento deseado, pueden merecer la pena porque reducen significativamente el tiempo y recursos necesarios para producir la copia de seguridad.

Pero con el tiempo , el número de archivos y la cantidad de datos modificados desde la última copia completa se hace cada vez más grande , y por lo tanto la copia de seguridad diferencial se hace más grande. Al final, el tiempo para hacer la copia diferencia es muy largo. Cuando esto sucede, es el momento de hacer una nueva copia de seguridad completa. Inmediatamente después de que se complete una nueva copia de seguridad completa, con el consiguiente tiempo y recursos perdidos, las diferenciales son de nuevo más pequeñas.

Las copias de seguridad incrementales intentan mantener las copias de seguridad al  tamaño más pequeño posible. Estas copias incrementales contienen copias de los datos y archivos que han cambiado desde la última copia de seguridad completa o la última copia de seguridad incremental. Si copias incrementales se realizan a diario, lo que suele ser, las copias incrementales de hoy incluye sólo los archivos que han cambiado desde la incremental de ayer.

El problema de las copias de seguridad incrementales es que las restauraciones puede necesitar un proceso de muchos pasos para realizarse. Si un disco se bloquea, por ejemplo, primero se restaura la última copia de seguridad completa. Entonces, la primera copia incremental debe ser restaurada para capturar los cambios que ocurrieron en el primer día. A continuación, la segunda incremental debe ser restaurada, y luego la tercera, la cuarta, y así sucesivamente hasta que se hayan restaurado todas las incrementales. Al igual que con las copias diferenciales, con el paso del tiempo se hará necesario realizar otra copia de seguridad completa, no para ahorrar tiempo en las copias de seguridad diarias, sino para asegurarse de que el proceso de restauración no lleve demasiado tiempo y recursos del sistema.

Tanto las copias diferenciales y técnicas incrementales, resuelven el problema de hacer copias completas periódicas mediante la programación de copias de seguridad completas todos los sábados o domingos a la medianoche, cuando es probable que sea el momento más bajo de la semana en consumo de recursos.

Pero copias de seguridad completas de grandes cantidades de datos a través de una WAN o a través de Internet son a menudo imposible, incluso si se realizan un fin de semana, no pudiendo terminar antes de que comience la semana de trabajo. Por esta razón, Jumbocopy (Powered by EVault) no utiliza ni copias de seguridad completas, ni diferenciales, ni incrementales. Una cuarta técnica patentada por EVault, mucho más eficiente, es la utilizada por JumboCopy para realizar las copias de seguridad.

Estar atentos a una serie nueva de entradas al blog donde desgranaremos más en concreto, los sistemas y técnicas empleadas por EVault para realizar las copias de seguridad online con la máxima eficacia.

Datos extractados del documento «Backup, Restore an Recovery Concepts» realizado por EVault, A Seagate Company.