Tabla de contenido:
Es solo a través del análisis de big data que el valor real de big data se vuelve claro. Pero, estos análisis requieren conocimientos estadísticos y técnicos para implementar cualquier solución de big data. Por lo tanto, se ha supuesto que debe ser un científico de datos para extraer información significativa de los grandes datos. Aquí es donde entra Apache Drill. Proporciona la flexibilidad para realizar análisis de big data en Hadoop sin necesidad de tener el conocimiento de un científico de datos.
Apache Drill - ¿Qué es?
Apache Drill es un marco de software que puede generar grandes cantidades de datos y proporcionar la información que necesita, escondiéndose debajo de los petabytes de los conjuntos de datos. Técnicamente, Apache Drill es un ANSI SQL estándar de código abierto que se puede utilizar como un motor de consulta de baja latencia en el popular marco de programación basado en Java Hadoop.
También puede funcionar con una manada de bases de datos NoSQL en ciernes como MongoDB, HBase y también con servidores de datos en la nube, como Amazon S3 y Google Cloud Storage. Además de esto, también supera el nivel de otras API estándar de la industria (interfaces de programación de aplicaciones) como ODBC / JDBC y RESTful API.