Hogar Bases de datos ¿Qué es la deduplicación de datos? - definición de techopedia

¿Qué es la deduplicación de datos? - definición de techopedia

Tabla de contenido:

Anonim

Definición: ¿Qué significa la desduplicación de datos?

La deduplicación de datos es una técnica de compresión de datos en la que se eliminan copias redundantes o repetidas de datos de un sistema. Se implementa en mecanismos de respaldo de datos y datos de red y permite el almacenamiento de una instancia única de datos dentro de una base de datos o sistema de información (IS).

La deduplicación de datos también se conoce como compresión inteligente, almacenamiento de instancia única, factorización común o reducción de datos.

Techopedia explica la desduplicación de datos

La deduplicación de datos funciona analizando y comparando segmentos de datos entrantes con datos almacenados previamente. Si los datos ya están presentes, los algoritmos de deduplicación de datos descartan los nuevos datos y crean una referencia. Por ejemplo, si un archivo de documento está respaldado con cambios, el archivo anterior y los cambios aplicados se agregan al segmento de datos. Sin embargo, si no hay diferencia, el archivo de datos más nuevo se descarta y se crea una referencia. Del mismo modo, un algoritmo de deduplicación de datos escanea los datos salientes en una conexión de red para verificar si hay duplicados, que se eliminan para aumentar la velocidad de transferencia de datos.

¿Qué es la deduplicación de datos? - definición de techopedia