Hogar En las noticias ¿Por qué es útil una matriz de confusión en el aprendizaje automático?

¿Por qué es útil una matriz de confusión en el aprendizaje automático?

Anonim

Q:

¿Por qué es útil una matriz de confusión en ML?

UN:

Hay varias formas de hablar sobre por qué una matriz de confusión es valiosa en el aprendizaje automático (ML), pero una de las formas más simples es explicar que la matriz de confusión es un recurso de visualización de datos.

Una matriz de confusión permite a los espectadores ver de un vistazo los resultados del uso de un clasificador u otro algoritmo. Al usar una tabla simple para mostrar resultados analíticos, la matriz de confusión esencialmente reduce sus resultados a una vista más digerible.

La matriz de confusión utiliza terminología específica para organizar los resultados. Hay verdaderos positivos y verdaderos negativos, así como falsos positivos y falsos negativos. Para una matriz de confusión más complicada o una basada en la clasificación de comparación, estos valores pueden mostrarse como clases reales y predichas para dos objetos distintos.

Independientemente de la terminología semántica, los resultados se agrupan en una tabla cuadrada (o rectangular).

Esta vista facilita a los analistas ver cuán preciso fue un algoritmo para clasificar los resultados. (Lea Nuevos generadores ponen algoritmos modernos a trabajar en el arte ASCII).

La utilidad de la matriz de confusión tiene que ver con la complejidad de los proyectos de LA y también con la forma en que la información se formatea y se entrega a los usuarios. Imagine una serie de resultados lineales que incluyen falsos positivos, falsos negativos, verdaderos positivos y verdaderos negativos. (Lea Machine Learning 101.)

Un usuario tendría que tabular todos esos resultados lineales en un gráfico para comprender cómo funcionaba el algoritmo y qué tan preciso era. Con la matriz de confusión, esta información simplemente se presenta en un poderoso modelo visual.

Por ejemplo, supongamos que se le pide a la máquina que clasifique 20 imágenes, de las cuales cinco son frutas y cinco son vegetales. Si una matriz de confusión contiene los siguientes contenidos (desde la parte superior izquierda en sentido horario): 7, 5, 3, 5, entonces la matriz muestra que siete fueron identificados correctamente como vegetales, mientras que tres fueron clasificados correctamente como frutas.

Los otros 10, como se representan, son resultados en los que el programa no pudo identificar correctamente la imagen.

La matriz de confusión será útil en todo tipo de análisis de ML. Al observar este recurso, los usuarios pueden descubrir cómo manejar problemas como la dimensionalidad y el sobreajuste, y otras formas de optimizar un algoritmo.

¿Por qué es útil una matriz de confusión en el aprendizaje automático?