Combinar fuentes de datos en Hadoop es un negocio complejo. Algunas de las razones para esto incluyen:
- Los scripts personalizados de origen específico que combinan orígenes de datos son problemáticos.
- El uso de herramientas de integración de datos o ciencia de datos introduce demasiada incertidumbre.
- Agregar datos de fuentes externas es casi imposible.
Hoy, analizaré cómo se mejora el análisis de Hadoop a través de tecnologías independientes de la fuente que facilitan la combinación de fuentes de datos internas y externas. Además de describir cómo funcionan los métodos independientes de la fuente, también cubriré por qué los análisis de Hadoop necesitan capacidades integradas de inteligencia y transferencia de conocimiento, una comprensión de las características de las relaciones y los datos, y una arquitectura escalable y de alto rendimiento.
Seminario web: Matrices de significado: Conexión de los puntos dentro de Hadoop - Regístrese aquí |
