Hogar Blogging ¿Qué es el raspado de contenido? - definición de techopedia

¿Qué es el raspado de contenido? - definición de techopedia

Tabla de contenido:

Anonim

Definición - ¿Qué significa Content Scraping?

El raspado de contenido es una forma ilegal de robar contenido original de un sitio web legítimo y publicar el contenido robado en otro sitio sin el conocimiento o permiso del propietario del contenido. Los raspadores de contenido a menudo intentan pasar el contenido robado como propio, y no proporcionan atribución a los propietarios del contenido.


El raspado de contenido se puede realizar a través de copiar y pegar manualmente, o puede usar técnicas más sofisticadas, como el uso de software especial, programación HTTP o analizadores HTML o DOM.


Gran parte del contenido que cae presa del raspado es material con derechos de autor; volver a publicarlo sin el permiso del propietario de los derechos de autor es un delito punible. Sin embargo, los sitios de raspadores están alojados en todo el mundo, y los raspadores a los que se les pide que eliminen contenido protegido por derechos de autor pueden simplemente cambiar los dominios o desaparecer.

Techopedia explica el raspado de contenido

Los raspadores de contenido pueden dirigir el tráfico a sus sitios web al raspar contenido de alta calidad y denso de palabras clave de otros sitios. Los bloggers son particularmente susceptibles a esto, probablemente porque es poco probable que los bloggers individuales inicien un ataque legal contra los scrapers. Se alienta a los raspadores a continuar esta práctica porque los motores de búsqueda aún no han encontrado una manera efectiva de filtrar el contenido único del contenido raspado, permitiendo que los raspadores sigan beneficiándose.


Los administradores del sitio web pueden protegerse contra el raspado mediante medidas simples, como agregar enlaces a su propio sitio dentro del contenido. Esto al menos les permitirá obtener algo de tráfico del contenido raspado. Los métodos más sofisticados para lidiar con el raspado por bots incluyen:

  • Aplicaciones comerciales anti-bot
  • Atrapar bots con un honeypot y bloquear sus direcciones IP
  • Bloqueo de bots con código JavaScript
¿Qué es el raspado de contenido? - definición de techopedia