Tabla de contenido:
Definición - ¿Qué significa Data Lake?
Un lago de datos es un depósito centralizado masivo, fácilmente accesible, de grandes volúmenes de datos estructurados y no estructurados.Techopedia explica Data Lake
La arquitectura del lago de datos es un enfoque de almacenamiento de todo para Big Data. Los datos no se clasifican cuando se almacenan en el repositorio, ya que el valor de los datos no está claro desde el principio. Como resultado, se elimina la preparación de datos. Por lo tanto, un lago de datos está menos estructurado en comparación con un almacén de datos convencional. Cuando se accede a los datos, solo entonces se clasifican, organizan o analizan.
Hadoop, un marco de código abierto para procesar y analizar grandes datos, se puede utilizar para filtrar los datos en el repositorio.