Tabla de contenido:
Definición - ¿Qué significa Datos sin etiquetar?
Los datos sin etiquetar son una designación para datos que no han sido etiquetados con etiquetas que identifican características, propiedades o clasificaciones. Los datos sin etiquetar se usan típicamente en varias formas de aprendizaje automático.
Techopedia explica los datos sin etiquetar
En los tipos de aprendizaje automático llamados aprendizaje automático no supervisado, el programa de aprendizaje automático opera mediante la evaluación de conjuntos de datos sin etiquetar. Debido a que los datos no tienen etiquetas, el programa de aprendizaje automático tiene que identificar cada pieza de datos en sus propiedades y características.
Una de las mejores formas de explicar esto es usando la metáfora del tazón de frutas. Supongamos que el programa de aprendizaje automático está aprendiendo a identificar tres tipos diferentes de frutas: plátanos, uvas y manzanas. Si los datos en el conjunto de entrenamiento inicial están etiquetados, el programa de aprendizaje automático funciona desde esa perspectiva, uniendo imágenes sucesivas con una de esas tres categorías.
Sin embargo, si ninguna de las piezas de datos está etiquetada con los tres nombres de frutas: plátanos, uvas y manzanas, el programa de aprendizaje automático tendrá que funcionar evaluando cada imagen y observando características como el color (amarillo, rojo o morado). largo y delgado, redondo o agrupado, y otras características.
A partir de este ejemplo, es fácil ver cómo los datos etiquetados ofrecen oportunidades mucho más fáciles de usar algoritmos de aprendizaje automático para obtener resultados de decisión. Sin embargo, los sofisticados programas de aprendizaje automático no supervisados que manejan datos sin etiquetar también pueden producir resultados asombrosamente precisos y precisos.