Tabla de contenido:
Definición - ¿Qué significa Apache Lucene?
Apache Lucene es un proyecto de código abierto para una biblioteca de motor de búsqueda de texto de alto rendimiento y con todas las funciones que se escribe completamente utilizando Java.
Es capaz de realizar búsquedas de texto completo en documentos, por lo que es una tecnología adecuada para cualquier aplicación que requiera esta función, especialmente si es multiplataforma.
Fue desarrollado por primera vez por Doug Cutting en 1999 y se convirtió oficialmente en parte de la familia de proyectos Java de código abierto Jakarta de la Fundación Apache en septiembre de 2001. Fue actualizado a un proyecto Apache de alto nivel en febrero de 2005.
Techopedia explica Apache Lucene
Apache Lucene es un motor de búsqueda de alto rendimiento con el concepto de "un documento que contiene campos de texto" en su arquitectura lógica central. Esto ofrece una gran flexibilidad y permite que la API de Lucene sea independiente de cualquier formato de archivo.
Cualquier texto de formatos como MS Word, HTML, XML, PDF y OpenDocument se puede indexar siempre que se pueda extraer la información textual, lo que significa que no puede hacer nada con las imágenes.
Lucene es adecuado para cualquier aplicación que necesite una indexación de texto completo y capacidad de búsqueda, pero es ampliamente reconocido como una gran utilidad para implementar motores de búsqueda en Internet y para búsquedas locales en un solo sitio.
Las características incluyen:
- Indexación escalable y de alto rendimiento: puede procesar más de 150 Gb por hora en hardware moderno y requiere solo 1 Mb por montón de requisitos de memoria.
- Algoritmos de búsqueda potentes, precisos y eficientes: ofrece muchos tipos de consultas potentes como frases, comodines, proximidad y consultas de rango. También ha enviado la búsqueda y la clasificación por cualquier campo.
- Multiplataforma: implementación pura de Java y también disponible en otros lenguajes de programación.