Tabla de contenido:
- Definición: ¿Qué significa la deduplicación posterior al procesamiento (PPD)?
- Techopedia explica la deduplicación posterior al procesamiento (PPD)
Definición: ¿Qué significa la deduplicación posterior al procesamiento (PPD)?
La deduplicación posterior al proceso (PPD) se refiere a un sistema en el que los procesos de software filtran datos redundantes de un conjunto de datos después de que se han transferido a una ubicación de almacenamiento de datos. Esto también se puede llamar deduplicación asincrónica, y a menudo se usa cuando los gerentes consideran que es ineficiente o inviable eliminar datos redundantes antes o durante la transferencia.
Techopedia explica la deduplicación posterior al procesamiento (PPD)
La deduplicación posterior al proceso puede contrastarse con una práctica llamada deduplicación en línea donde los datos redundantes se extraen a medida que los datos se transfieren para su almacenamiento. Una de las razones por las que los administradores pueden elegir un enfoque de deduplicación posterior al proceso es cuando la deduplicación en línea puede ralentizar el proceso de transferencia y hacer que sea más difícil archivar datos de manera fácil y eficiente.
Si bien los gerentes o administradores pueden encontrar que es más fácil usar un método de deduplicación posterior al proceso, existen inconvenientes para este tipo de optimización de datos. Uno es el hecho de que el destino de almacenamiento de datos necesitará tener suficiente espacio para adaptarse al conjunto de datos sin filtrar más grande. Suponiendo que los administradores de datos tienen un amplio almacenamiento y que analizar los datos en el almacenamiento no plantea dificultades técnicas, el método de deduplicación posterior al proceso a menudo puede ser una forma deseable de limpiar un conjunto de datos para su uso futuro después de que ya se haya guardado cuidadosamente "almacenamiento en frio."




