Q:
¿Cuáles son algunos de los temas clave a considerar en una estrategia de almacenamiento de big data?
UN:Uno de los mayores problemas que se ignora para el almacenamiento de big data es la accesibilidad para los equipos que lo necesitan. Los datos se almacenan regularmente sin documentación, en lugares donde es difícil acceder o donde los equipos relevantes son ajenos al hecho de que existe. En última instancia, el almacenamiento de big data debería adoptar una primera estrategia abierta en la que los equipos conozcan su existencia, en qué consisten los datos y cómo acceder a ellos para que los equipos puedan utilizarlos en el software si lo necesitan.
Otro problema crítico que encuentro es la calidad de los datos que se almacenan. Los datos deben almacenarse en la forma de más alta calidad que pueda existir en su lugar de almacenamiento final. Almacenar datos de baja calidad en un lago de datos generalmente está bien, pero a medida que avanza por la tubería de datos, cada etapa debería aumentar la calidad de los datos de modo que se almacenen en la forma de mayor calidad en un sistema como un almacén de datos o una base de datos analítica. Esto aumentará la calidad de los sistemas que consumen el lugar de descanso de los datos.