Tabla de contenido:
Definición: ¿Qué significa SQL en Hadoop?
SQL on Hadoop es un tipo de herramienta de aplicación analítica: la implementación de SQL en la plataforma Hadoop, que combina consultas estándar de estilo SQL de datos estructurados con el marco de datos Hadoop. Hadoop es una plataforma relativamente nueva, como lo son los grandes datos, y no muchos profesionales son expertos en ella, pero SQL en Hadoop simplifica el acceso al marco de Hadoop y facilita la implementación en los sistemas empresariales actuales.
Techopedia explica SQL en Hadoop
SQL en Hadoop se refiere a varias implementaciones de SQL para la plataforma Hadoop. MapReduce, que es el mapeador de trabajos de clúster de Hadoop y el organizador de resultados, admite SQL como un caso de uso importante, así como otros métodos de procesamiento. Por lo tanto, tiene sentido crear herramientas poderosas para permitir SQL, que es uno de los lenguajes más utilizados para la consulta y manipulación de bases de datos. A medida que Hadoop gana popularidad para la arquitectura de datos empresariales, SQL es clave para la adopción adecuada tanto de datos estructurados libremente como de datos estructurados utilizados en Hadoop.
Los controladores clave de SQL en Hadoop incluyen:
- Aprovechando las habilidades SQL existentes en la mayoría de las organizaciones
- Reutilización de la carga de transformación de extracción (ETL), inteligencia empresarial (BI) e inversiones en infraestructura analítica en Hadoop
Algunas implementaciones de SQL en Hadoop incluyen:
- Apache Spark SQL
- Colmena Apache
- Apache Tajo
- Taladro Apache
- HP Vertica en MapR
- Controladores ODBC
- Presto
- Tiburón
