Tabla de contenido:
Definición - ¿Qué significa Overfitting?
En estadística y aprendizaje automático, el sobreajuste ocurre cuando un modelo intenta predecir una tendencia en los datos que es demasiado ruidosa. El sobreajuste es el resultado de un modelo demasiado complejo con demasiados parámetros. Un modelo que está sobreajustado es inexacto porque la tendencia no refleja la realidad de los datos.
Techopedia explica Overfitting
Un modelo sobreajustado es un modelo con una línea de tendencia que refleja los errores en los datos con los que se entrena, en lugar de predecir con precisión los datos no vistos. Esto se ve mejor visualmente con un gráfico de puntos de datos y una línea de tendencia. Un modelo sobreajustado muestra una curva con puntos más altos y más bajos, mientras que un modelo ajustado adecuadamente muestra una curva suave o una regresión lineal.
El principal problema con el sobreajuste es que el modelo ha memorizado efectivamente los puntos de datos existentes en lugar de intentar predecir qué tan invisibles serían los puntos de datos.
El sobreajuste generalmente resulta de un número excesivo de puntos de entrenamiento. Hay una serie de técnicas que los investigadores de aprendizaje automático pueden usar para mitigar el sobreajuste, incluida la validación cruzada, la regularización, la detención temprana, la poda, los antecedentes bayesianos, la deserción y la comparación de modelos.