dcsimg

deduplicación de datos

Deduplicación de datos es una técnica utilizada para reducir la cantidad de espacio de almacenamiento que una organización necesita para guardar sus datos. En la mayoría de las organizaciones, los sistemas de almacenamiento contienen copias duplicadas de muchos datos. Por ejemplo, el mismo archivo puede ser guardado en varios lugares diferentes por diferentes usuarios, o dos o más archivos que no son idénticos pueden incluir muchos de los mismos datos.

La deduplicación elimina estas copias adicionales al guardar solo una copia de los datos y reemplazar las otras copias con punteros que conducen a la copia original. Las empresas utilizan con frecuencia la deduplicación en aplicaciones de respaldo y recuperación de desastres, pero también se puede usar para liberar espacio en el almacenamiento primario.



elemento de configuración ejemplo itil

Deduplicación a nivel de archivo o bock

En su forma más simple, la deduplicación tiene lugar a nivel de archivo; es decir, elimina las copias duplicadas del mismo archivo. Este tipo de deduplicación a veces se denomina deduplicación a nivel de archivo o almacenamiento de instancia única (SIS). La deduplicación también puede tener lugar a nivel de bloque, eliminando los bloques de datos duplicados que se producen en archivos no idénticos.

La deduplicación a nivel de bloque libera más espacio que SIS, y un tipo particular conocido como deduplicación de bloque variable o de longitud variable se ha vuelto muy popular. A menudo, la frase deduplicación de datos se utiliza como sinónimo de deduplicación a nivel de bloque o de longitud variable.

¿Qué significa el acrónimo "http"?

Beneficios de la deduplicación de datos

El principal beneficio de la deduplicación de datos es que reduce la cantidad de disco o cinta que las organizaciones necesitan comprar, lo que a su vez reduce los costos. NetApp informa que, en algunos casos, la deduplicación puede reducir los requisitos de almacenamiento hasta en un 95 por ciento, pero el tipo de datos que intenta deduplicar y la cantidad de archivos compartidos que hace su organización influirán en su propia tasa de deduplicación. Si bien la deduplicación se puede aplicar a los datos almacenados en cinta, los costos relativamente altos del almacenamiento en disco hacen de la deduplicación una opción muy popular para los sistemas basados ​​en disco. La eliminación de copias adicionales de datos ahorra dinero no solo en costos directos de disco duro, sino también en costos relacionados, como electricidad, enfriamiento, mantenimiento, espacio en el piso, etc.

La deduplicación también puede reducir la cantidad de ancho de banda de red requerido para los procesos de respaldo y, en algunos casos, puede acelerar el proceso de respaldo y recuperación.

Deduplicación frente a compresión

La deduplicación a veces se confunde con la compresión, otra técnica para reducir los requisitos de almacenamiento. Mientras que la deduplicación elimina los datos redundantes, la compresión utiliza algoritmos para guardar datos de forma más concisa. Parte de la compresión no tiene pérdida, lo que significa que no se pierden datos en el proceso, pero la compresión "con pérdida", que se usa con frecuencia con archivos de audio y video, en realidad elimina algunos de los datos menos importantes incluidos en un archivo para ahorrar espacio. Por el contrario, la deduplicación solo elimina las copias adicionales de datos; no se pierde ninguno de los datos originales. Además, la compresión no elimina los datos duplicados: el sistema de almacenamiento aún podría contener múltiples copias de archivos comprimidos.

La deduplicación a menudo tiene un impacto mayor en el tamaño del archivo de respaldo que la compresión. En una situación de copia de seguridad empresarial típica, la compresión puede reducir el tamaño de la copia de seguridad en una proporción de 2: 1 o 3: 1, mientras que la deduplicación puede reducir el tamaño de la copia de seguridad hasta en 25: 1, según la cantidad de datos duplicados que haya en los sistemas. A menudo, las empresas utilizan la deduplicación y la compresión juntas para maximizar sus ahorros.



Implementación de la deduplicación de datos

El proceso para implementar la tecnología de deduplicación de datos varía ampliamente según el tipo de producto y el proveedor. Por ejemplo, si se incluye tecnología de deduplicación en un dispositivo de respaldo o solución de almacenamiento, el proceso de implementación será muy diferente al del software de deduplicación independiente.

qué versión es lollipop para android

En general, la tecnología de deduplicación se puede implementar en uno de dos procesos básicos: en el origen o en el destino. En la deduplicación de origen, las copias de datos se eliminan en el almacenamiento primario antes de que los datos se envíen al sistema de respaldo. La ventaja de la deduplicación de origen es que reduce los requisitos de ancho de banda y el tiempo necesario para realizar copias de seguridad de los datos. En el lado negativo, la deduplicación de origen consume más recursos del procesador y puede resultar difícil de integrar con los sistemas y aplicaciones existentes.

Por el contrario, la deduplicación de destino se lleva a cabo dentro del sistema de respaldo y, a menudo, es mucho más fácil de implementar. La deduplicación de destino se presenta en dos tipos: en línea o posproceso. La deduplicación en línea tiene lugar antes de que la copia de seguridad se escriba en el disco o la cinta. La ventaja de la deduplicación en línea es que requiere menos espacio de almacenamiento que la deduplicación posterior al proceso, pero puede ralentizar el proceso de copia de seguridad. La deduplicación posterior al proceso tiene lugar después de que se haya escrito la copia de seguridad, por lo que requiere que las organizaciones tengan una gran cantidad de espacio de almacenamiento disponible para la copia de seguridad original. Sin embargo, la deduplicación posterior al proceso suele ser más rápida que la deduplicación en línea.

Tecnología de deduplicación

La deduplicación de datos es una tecnología altamente patentada. Los métodos de deduplicación varían ampliamente de un proveedor a otro, y muchos de esos métodos están patentados. Por ejemplo, Microsoft tiene una patente sobre almacenamiento de instancia única. Además, Quantum posee una patente sobre deduplicación de longitud variable. Muchos otros proveedores también poseen patentes relacionadas con la tecnología de deduplicación.