Tabla de contenido:
Definición - ¿Qué significa Data Cube?
Un cubo de datos se refiere a un rango tridimensional (3D) (o superior) de valores que generalmente se utilizan para explicar la secuencia de tiempo de los datos de una imagen. Es una abstracción de datos para evaluar datos agregados desde una variedad de puntos de vista. También es útil para la espectroscopía de imágenes, ya que una imagen resuelta espectralmente se representa como un volumen tridimensional.
Un cubo de datos también se puede describir como extensiones multidimensionales de tablas bidimensionales. Se puede ver como una colección de tablas 2-D idénticas apiladas una sobre la otra. Los cubos de datos se usan para representar datos que son demasiado complejos para ser descritos por una tabla de columnas y filas. Como tal, los cubos de datos pueden ir mucho más allá de 3-D para incluir muchas más dimensiones.
Techopedia explica Data Cube
Un cubo de datos se usa generalmente para interpretar fácilmente los datos. Es especialmente útil cuando se representan datos junto con dimensiones como ciertas medidas de requisitos comerciales. Cada dimensión de un cubo representa ciertas características de la base de datos, por ejemplo, ventas diarias, mensuales o anuales. Los datos incluidos dentro de un cubo de datos permiten analizar casi todas las cifras de prácticamente todos o algunos clientes, agentes de ventas, productos y mucho más. Por lo tanto, un cubo de datos puede ayudar a establecer tendencias y analizar el rendimiento.
Los cubos de datos se clasifican principalmente en dos categorías:
- Cubo de datos multidimensional: la mayoría de los productos OLAP se desarrollan en base a una estructura en la que el cubo está diseñado como una matriz multidimensional. Estos productos OLAP multidimensionales (MOLAP) generalmente ofrecen un rendimiento mejorado en comparación con otros enfoques, principalmente porque pueden indexarse directamente en la estructura del cubo de datos para recopilar subconjuntos de datos. Cuando el número de dimensiones es mayor, el cubo se vuelve más escaso. Eso significa que varias celdas que representan combinaciones de atributos particulares no contendrán datos agregados. Esto a su vez aumenta los requisitos de almacenamiento, que a veces pueden alcanzar niveles indeseables, haciendo que la solución MOLAP sea insostenible para grandes conjuntos de datos con muchas dimensiones. Las técnicas de compresión pueden ayudar; sin embargo, su uso puede dañar la indexación natural de MOLAP.
- OLAP relacional: OLAP relacional utiliza el modelo de base de datos relacional. El cubo de datos ROLAP se emplea como un grupo de tablas relacionales (aproximadamente el doble que la cantidad de dimensiones) en comparación con una matriz multidimensional. Cada una de estas tablas, conocida como cuboide, significa una vista específica.