Hogar Audio ¿Cómo podrían las empresas utilizar modelos forestales aleatorios para las predicciones?

¿Cómo podrían las empresas utilizar modelos forestales aleatorios para las predicciones?

Anonim

Q:

¿Cómo podrían las empresas utilizar modelos forestales aleatorios para las predicciones?

UN:

Las empresas suelen utilizar modelos forestales aleatorios para hacer predicciones con los procesos de aprendizaje automático. El bosque aleatorio utiliza múltiples árboles de decisión para hacer un análisis más holístico de un conjunto de datos dado.

Un solo árbol de decisión funciona sobre la base de separar una determinada variable o variables de acuerdo con un proceso binario. Por ejemplo, al evaluar conjuntos de datos relacionados con un conjunto de automóviles o vehículos, un solo árbol de decisión podría clasificar y clasificar cada vehículo individual por peso, separándolos en vehículos pesados ​​o ligeros.

El bosque aleatorio se basa en el modelo de árbol de decisión y lo hace más sofisticado. Los expertos hablan de que los bosques aleatorios representan la "discriminación estocástica" o el método de "adivinación estocástica" en los datos aplicados a espacios multidimensionales. La discriminación estocástica tiende a ser una forma de mejorar el análisis de los modelos de datos más allá de lo que puede hacer un solo árbol de decisión.

Básicamente, un bosque aleatorio crea muchos árboles de decisión individuales que trabajan en variables importantes con un determinado conjunto de datos aplicado. Un factor clave es que en un bosque aleatorio, el conjunto de datos y el análisis variable de cada árbol de decisión se superpondrán típicamente. Eso es importante para el modelo, porque el modelo de bosque aleatorio toma los resultados promedio para cada árbol de decisión y los factoriza en una decisión ponderada. En esencia, el análisis toma todos los votos de varios árboles de decisión y construye un consenso para ofrecer resultados productivos y lógicos.

Un ejemplo de uso productivo de un algoritmo forestal aleatorio está disponible en el sitio R-blogger, donde el escritor Teja Kodali toma el ejemplo de determinar la calidad del vino a través de factores como la acidez, el azúcar, los niveles de dióxido de azufre, el valor del pH y el contenido de alcohol. Kodali explica cómo un algoritmo de bosque aleatorio utiliza un pequeño subconjunto aleatorio de características para cada árbol individual y luego utiliza los promedios resultantes.

Con esto en mente, las empresas que deseen utilizar algoritmos de aprendizaje automático de máquinas forestales para el modelado predictivo primero aislarán los datos predictivos que deben resumirse en un conjunto de producciones, y luego los aplicarán al modelo forestal aleatorio utilizando cierto conjunto de capacitación. datos. Los algoritmos de aprendizaje automático toman esos datos de entrenamiento y trabajan con ellos para evolucionar más allá de las limitaciones de su programación original. En el caso de los modelos forestales aleatorios, la tecnología aprende a formar resultados predictivos más sofisticados utilizando esos árboles de decisión individuales para construir su consenso forestal aleatorio.

Una forma en que esto podría aplicarse a las empresas es tomar varias variables de propiedad del producto y utilizar un bosque aleatorio para indicar el posible interés del cliente. Por ejemplo, si existen factores conocidos de interés del cliente, como el color, el tamaño, la durabilidad, la portabilidad o cualquier otra cosa en la que los clientes hayan mostrado interés, esos atributos se pueden alimentar a los conjuntos de datos y analizar en función de su propio impacto único para multifactor. análisis.

¿Cómo podrían las empresas utilizar modelos forestales aleatorios para las predicciones?