Tabla de contenido:
Definición - ¿Qué significa Spider Trap?
Una trampa de araña es una función en línea que atrapa a un rastreador web o bot en un bucle infinito u otra situación recursiva que consume sus recursos y esencialmente ata a ese rastreador para un conjunto específico de iteraciones.
Una trampa de araña también se conoce como trampa de orugas.
Techopedia explica Spider Trap
Algunas trampas de araña están hechas para desviar intencionalmente la atención de los rastreadores web. Por ejemplo, alguien puede programar una estructura de directorio profunda para que el rastreador web se arrastre hacia abajo en esa estructura en lugar de moverse a otras áreas de un sitio o espacio en línea. Los programadores también pueden sobrecargar el analizador léxico del rastreador, o cargar una sesión con cookies para drenar los recursos de los robots de spam u otros rastreadores.
Otras trampas de araña se hacen involuntariamente a través de errores de programación. Algunos tipos de referencias de calendario pueden causar bucles aparentemente infinitos y bloquear rastreadores mal hechos.
El uso de trampas de araña y otros diseños para frustrar los rastreadores web robóticos va a cambiar con la aparición de nuevos principios de aprendizaje automático e inteligencia artificial. Dado que los diseñadores han demostrado que ahora pueden hacer rastreadores web que pueden responder a los comandos en la página de la misma manera que los humanos, los recursos como CAPTCHA ya no serán efectivos contra los usuarios robóticos. Las trampas de araña y las trampas de rastreadores probablemente tampoco lo harán, porque las partes que usan los rastreadores o bots los invertirán con la capacidad de reconocer estas trampas y evitarlas.
