Hogar Seguridad ¿Qué es la perturbación de datos? - definición de techopedia

¿Qué es la perturbación de datos? - definición de techopedia

Tabla de contenido:

Anonim

Definición - ¿Qué significa Perturbación de datos?

La perturbación de datos es una forma de minería de datos para preservar la privacidad de los registros electrónicos de salud (EHR). Hay dos tipos principales de perturbación de datos apropiados para la protección de datos de EHR. El primer tipo se conoce como enfoque de distribución de probabilidad y el segundo tipo se llama enfoque de distorsión de valor. La perturbación de datos se considera una técnica relativamente fácil y efectiva para proteger los datos electrónicos sensibles del uso no autorizado.

Techopedia explica la perturbación de datos

La perturbación de datos ha sido aclamada como una aplicación más efectiva de protección de datos en la atención de la salud que la desidentificación / reidentificación debido a la mayor probabilidad de que se produzcan ataques que vinculen conjuntos de datos públicos con identificadores o sujetos originales. Por esta misma razón, la perturbación de datos es aclamada como una aplicación más sólida cuando se trata de seguridad EHR.


El enfoque de distribución de probabilidad toma los datos y los reemplaza de la misma muestra de distribución o de la distribución misma. El enfoque de distorsión de valor perturba los datos mediante ruido multiplacativo o aditivo u otros procesos aleatorios. Se considera más efectivo que el tipo anterior de perturbación. Este enfoque construye clasificadores de árbol de decisión donde a cada elemento se le asigna ruido aleatorio de la distribución gaussiana, por ejemplo. Mediante la minería de datos, la distribución de datos original se reconstruye a partir de su versión perturbada. Sin embargo, los críticos señalan el hecho de que el ruido aditivo aleatorio puede filtrarse, lo que puede resultar en compromisos de privacidad de EHR.

¿Qué es la perturbación de datos? - definición de techopedia