En tiempos pasados, al pensar en datos digitales, tenía sentido segregar datos entre datos transaccionales, los datos capturados en aplicaciones comerciales, almacenados en tablas de bases de datos y presentados por herramientas de BI, y todos los demás datos: correos electrónicos, páginas web, imágenes, video y así. Hoy en día tendemos a referirnos a "otros datos" como datos no estructurados.
Sin embargo, era analizable y el software para obtener valor de tales datos ha cruzado el abismo. Fue ese imperativo analítico más que cualquier otra cosa lo que dio origen al concepto original de un lago de datos, un almacén de datos para ambas especies de datos y, además, para los datos recolectados de múltiples fuentes externas al negocio, algunos de los cuales estaban inevitablemente desestructurados.
En este documento, examinaremos cómo el nuevo ecosistema creado por el lago de datos ya no consistirá completamente en las transacciones (o eventos) de la empresa. También incluirá datos de otras fuentes, que la empresa utiliza para realizar análisis e informar a sus usuarios de información importante en la que se pueden basar las decisiones. El sistema de registro será, como siempre fue, la copia de oro de los datos corporativos y la pista de auditoría de las actividades de TI de la empresa.