Q:
¿Por qué es importante la anotación de datos en algunos proyectos de aprendizaje automático?
UN:La anotación de datos es importante en el aprendizaje automático porque, en muchos casos, facilita mucho el trabajo del programa de aprendizaje automático.
Esto tiene que ver con la diferencia entre el aprendizaje automático supervisado y no supervisado. Con el aprendizaje automático supervisado, los datos de entrenamiento ya están etiquetados para que la máquina pueda comprender más acerca de los resultados deseados. Por ejemplo, si el propósito del programa es identificar gatos en imágenes, el sistema ya tiene una gran cantidad de fotos etiquetadas como gato o no. Luego usa esos ejemplos para contrastar nuevos datos para obtener sus resultados.
Descarga gratuita: Aprendizaje automático y por qué es importante |
Con el aprendizaje automático no supervisado, no hay etiquetas, por lo que el sistema tiene que usar atributos y otras técnicas para identificar a los gatos. Los ingenieros pueden entrenar el programa para reconocer las características visuales de los gatos como bigotes o colas, pero el proceso casi nunca es tan sencillo como lo sería en el aprendizaje automático supervisado donde esas etiquetas juegan un papel muy importante.
La anotación de datos es el proceso de colocar etiquetas en los conjuntos de datos de entrenamiento. Estos se pueden aplicar de muchas maneras diferentes; anteriormente hablamos sobre la anotación de datos binarios, gatos o no gatos, pero también son importantes otros tipos de anotación de datos. Por ejemplo, en el campo médico, la anotación de datos puede implicar etiquetar imágenes biológicas específicas con etiquetas que identifiquen patologías o marcadores de enfermedades para otras propiedades médicas.
La anotación de datos requiere trabajo, y a menudo la realizan equipos de personas, pero es una parte fundamental de lo que hace que muchos proyectos de aprendizaje automático funcionen con precisión. Proporciona esa configuración inicial para enseñar a un programa lo que necesita aprender y cómo discriminar contra varias entradas para obtener salidas precisas.