Q:
¿Por qué los gerentes deben protegerse contra la redundancia de la base de datos?
UN:Los administradores de bases de datos y otros profesionales de TI deben protegerse contra la "redundancia de base de datos" o la "redundancia de datos" debido a todos los impactos negativos que la redundancia puede tener en un sistema o entorno de base de datos. Siempre que se duplica una determinada pieza de datos, ya sea en dos campos en una base de datos o en dos entornos de bases de datos diferentes, puede tener consecuencias para la recuperación de datos.
Una de las primeras razones para evitar la redundancia de datos es que puede ser derrochador o excesivo.
Es importante señalar que se planifican algunos tipos de redundancia de datos para proteger y realizar copias de seguridad de los datos. Sin embargo, otros surgen de una codificación pobre o ineficiente, o la falta de atención a las mejores prácticas. En muchos casos, grandes cantidades de redundancia de datos hacen que la base de datos crezca rápidamente más allá de un tamaño razonable. Con esto en mente, se realizan muchos esfuerzos para combatir la redundancia de datos para ahorrar espacio en una base de datos y, en consecuencia, para reducir los costos y el esfuerzo de mantenimiento. Sin embargo, esto debe hacerse teniendo en cuenta la practicidad: los ingenieros pueden practicar algo llamado deduplicación de datos, pero debe hacerse de manera eficiente.
Por ejemplo, los administradores de bases de datos pueden explorar algo como quitar una cadena de un campo repetido, como un nombre de cliente o empresa compartido, y reemplazarla con una referencia de variable simple donde la cadena se encuentra en otro lugar. Esto puede ahorrar espacio en una base de datos, pero también puede requerir más actividad del servidor para realizar una consulta determinada, por lo que podría no ser tan eficiente como parece.
Otra gran razón para deduplicar datos o evitar la redundancia de datos es la confusión que puede resultar. Los datos redundantes en una base de datos pueden causar varios tipos de anomalías. Una de ellas se llama anomalía de actualización: las anomalías de actualización ocurren cuando se vuelve a ingresar un registro con información actualizada, pero la actualización no vuelve al registro original. En tal situación, puede haber tres registros diferentes para un empleado particular de la compañía, con tres títulos de trabajo diferentes y tres direcciones diferentes, porque la información de la persona no se actualizó en toda la base de datos, sino solo en el último registro ingresado.
Según lo sugerido por los expertos, los administradores de bases de datos pueden evitar la redundancia de datos por diseño. También pueden participar en prácticas de normalización de datos que pueden corregir anomalías de actualización y otros tipos de anomalías al estandarizar las formas en que se mantienen los registros de las tablas de la base de datos. Los administradores de bases de datos también pueden realizar esfuerzos de deduplicación de datos que limpian y estandarizan los datos de otras maneras. Todo esto sirve para crear tablas de bases de datos más limpias, hacer que los registros de las bases de datos sean más consistentes y evitar todos los dolores de cabeza y problemas complejos asociados con la redundancia de datos no planificada.