Tabla de contenido:
Definición - ¿Qué significa validación cruzada?
La validación cruzada es una técnica que se utiliza para evaluar cómo los resultados del análisis estadístico se generalizan a un conjunto de datos independiente. La validación cruzada se usa en gran medida en entornos donde el objetivo es la predicción y es necesario estimar la precisión del rendimiento de un modelo predictivo. La razón principal para el uso de la validación cruzada en lugar de la validación convencional es que no hay suficientes datos disponibles para dividirlos en conjuntos de entrenamiento y prueba separados (como en la validación convencional). Esto da como resultado una pérdida de capacidad de prueba y modelado.
La validación cruzada también se conoce como estimación de rotación.
Techopedia explica la validación cruzada
Para un problema de predicción, generalmente se proporciona un modelo con un conjunto de datos de datos conocidos, llamado conjunto de datos de entrenamiento, y un conjunto de datos desconocidos contra los cuales se prueba el modelo, conocido como el conjunto de datos de prueba. El objetivo es tener un conjunto de datos para probar el modelo en la fase de capacitación y luego proporcionar información sobre cómo el modelo específico se adapta a un conjunto de datos independiente. Una ronda de validación cruzada comprende la división de datos en subconjuntos complementarios, luego se realiza el análisis en un subconjunto. Después de esto, el análisis se valida en otros subconjuntos (conjuntos de prueba). Para reducir la variabilidad, se realizan muchas rondas de validación cruzada utilizando muchas particiones diferentes y luego se toma un promedio de los resultados. La validación cruzada es una técnica poderosa en la estimación de la técnica de rendimiento del modelo.