Hogar Desarrollo ¿Qué es un proceso de decisión de markov (mdp)? - definición de techopedia

¿Qué es un proceso de decisión de markov (mdp)? - definición de techopedia

Tabla de contenido:

Anonim

Definición: ¿Qué significa el Proceso de decisión de Markov (MDP)?

Un proceso de decisión de Markov (MDP) es algo a lo que los profesionales se refieren como un "proceso de control estocástico de tiempo discreto". Se basa en las matemáticas iniciadas por el académico ruso Andrey Markov a fines del siglo XIX y principios del XX.

Techopedia explica el proceso de decisión de Markov (MDP)

Una forma de explicar un proceso de decisión de Markov y las cadenas de Markov asociadas es que estos son elementos de la teoría de juegos moderna basada en una investigación matemática más simple realizada por el científico ruso hace unos cien años. La descripción de un proceso de decisión de Markov es que estudia un escenario en el que un sistema se encuentra en un conjunto determinado de estados y avanza a otro estado en función de las decisiones de un tomador de decisiones.

Una cadena de Markov como modelo muestra una secuencia de eventos donde la probabilidad de un evento determinado depende de un estado alcanzado previamente. Los profesionales pueden hablar sobre un "espacio de estado contable" al describir el proceso de decisión de Markov; algunos asocian la idea del modelo de decisión de Markov con un modelo de "caminata aleatoria" u otro modelo estocástico basado en probabilidades (el modelo de caminata aleatoria, a menudo citado en Wall Street, modela el movimiento de una equidad hacia arriba o hacia abajo en un contexto de probabilidad de mercado).

En general, los procesos de decisión de Markov a menudo se aplican a algunas de las tecnologías más sofisticadas en las que los profesionales están trabajando actualmente, por ejemplo, en robótica, automatización y modelos de investigación.

¿Qué es un proceso de decisión de markov (mdp)? - definición de techopedia