SlideShare une entreprise Scribd logo
1  sur  12
Universidad Técnica particular de Loja Aprendizaje por Refuerzo Por: Alexandra Cueva E.
Introducción ,[object Object],[object Object],[object Object],Oficina Camino Dañado Camino libre
Introducción ,[object Object]
Aprendizaje por Refuerzo ,[object Object],[object Object],Entorno T(s,a) R(s,a) Agente π (s) a r s’ r s
Aprendizaje por Refuerzo ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Proceso de decisión de Markov ,[object Object],[object Object]
Proceso de decisión de Markov ,[object Object]
Proceso de Decisión de Markov ,[object Object],[object Object],a1=0,1 a2=1 a1=0,9 a1=0,9 a3=0,5 a2=1 a3=0,5 a1=0,1 meta
Proceso de Decisión de Markov ,[object Object],[object Object]
Descomposición de las cadenas de Markov ,[object Object],[object Object]
Descomposición de las cadenas de Markov ,[object Object],[object Object]
Bibliografía ,[object Object],[object Object]

Contenu connexe

Tendances

Cadenas de markov
Cadenas de markovCadenas de markov
Cadenas de markovPoro Punk
 
Procesos estocasticos blog
Procesos estocasticos blogProcesos estocasticos blog
Procesos estocasticos blogingverdu
 
Taller investigación de operaciones ii segundo seguimiento (1)
Taller investigación de operaciones ii   segundo seguimiento (1)Taller investigación de operaciones ii   segundo seguimiento (1)
Taller investigación de operaciones ii segundo seguimiento (1)Oscar José Ospino Ayala
 
Unidad II Introduccion a los procesos de Markov
Unidad II Introduccion a los procesos de MarkovUnidad II Introduccion a los procesos de Markov
Unidad II Introduccion a los procesos de MarkovSocorro Lomeli Sanchez
 
CUANTIZACIÓN DEL VECTOR DE APRENDIZAJE
CUANTIZACIÓN DEL VECTOR DE APRENDIZAJECUANTIZACIÓN DEL VECTOR DE APRENDIZAJE
CUANTIZACIÓN DEL VECTOR DE APRENDIZAJEESCOM
 
Cadenas de Markov_BLOG_UNEXPO
Cadenas de Markov_BLOG_UNEXPOCadenas de Markov_BLOG_UNEXPO
Cadenas de Markov_BLOG_UNEXPOYoratzi Gonzalez
 

Tendances (13)

Cadenas de Markov
Cadenas de MarkovCadenas de Markov
Cadenas de Markov
 
Cadenas markov (1)
Cadenas markov (1)Cadenas markov (1)
Cadenas markov (1)
 
Cadenas de markov
Cadenas de markovCadenas de markov
Cadenas de markov
 
Cmtd
CmtdCmtd
Cmtd
 
Procesos estocasticos blog
Procesos estocasticos blogProcesos estocasticos blog
Procesos estocasticos blog
 
Matriz transicion
Matriz transicionMatriz transicion
Matriz transicion
 
Taller investigación de operaciones ii segundo seguimiento (1)
Taller investigación de operaciones ii   segundo seguimiento (1)Taller investigación de operaciones ii   segundo seguimiento (1)
Taller investigación de operaciones ii segundo seguimiento (1)
 
Unidad II Introduccion a los procesos de Markov
Unidad II Introduccion a los procesos de MarkovUnidad II Introduccion a los procesos de Markov
Unidad II Introduccion a los procesos de Markov
 
Cadenas de markov
Cadenas de markovCadenas de markov
Cadenas de markov
 
CUANTIZACIÓN DEL VECTOR DE APRENDIZAJE
CUANTIZACIÓN DEL VECTOR DE APRENDIZAJECUANTIZACIÓN DEL VECTOR DE APRENDIZAJE
CUANTIZACIÓN DEL VECTOR DE APRENDIZAJE
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
Cadenas de Markov_BLOG_UNEXPO
Cadenas de Markov_BLOG_UNEXPOCadenas de Markov_BLOG_UNEXPO
Cadenas de Markov_BLOG_UNEXPO
 
Cadenas de markov io2
Cadenas de markov io2Cadenas de markov io2
Cadenas de markov io2
 

En vedette

REDES NEURONALES Algoritmos de Aprendizaje
REDES NEURONALES Algoritmos  de AprendizajeREDES NEURONALES Algoritmos  de Aprendizaje
REDES NEURONALES Algoritmos de AprendizajeESCOM
 
Aprendizaje por reforzamiento
Aprendizaje por reforzamientoAprendizaje por reforzamiento
Aprendizaje por reforzamientoSEBITAS1
 
Motivación y emociones
Motivación y emocionesMotivación y emociones
Motivación y emocionesjuanmaconde
 
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONGEMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONGFANNY JEM WONG MIÑÁN
 
Toma de Decisiones Herbert Simon
Toma de Decisiones Herbert SimonToma de Decisiones Herbert Simon
Toma de Decisiones Herbert Simongarciara
 
Paginas de matematicas
Paginas de matematicasPaginas de matematicas
Paginas de matematicasespanol
 

En vedette (10)

aprendizaje por refuerzo
aprendizaje por refuerzoaprendizaje por refuerzo
aprendizaje por refuerzo
 
REDES NEURONALES Algoritmos de Aprendizaje
REDES NEURONALES Algoritmos  de AprendizajeREDES NEURONALES Algoritmos  de Aprendizaje
REDES NEURONALES Algoritmos de Aprendizaje
 
Aprendizaje por reforzamiento
Aprendizaje por reforzamientoAprendizaje por reforzamiento
Aprendizaje por reforzamiento
 
Motivación y emociones
Motivación y emocionesMotivación y emociones
Motivación y emociones
 
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONGEMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
 
Toma de Decisiones Herbert Simon
Toma de Decisiones Herbert SimonToma de Decisiones Herbert Simon
Toma de Decisiones Herbert Simon
 
Teorías de la motivación
Teorías de la motivaciónTeorías de la motivación
Teorías de la motivación
 
Sentimientos y emociones
Sentimientos y emocionesSentimientos y emociones
Sentimientos y emociones
 
La psicología social 1
La psicología social 1La psicología social 1
La psicología social 1
 
Paginas de matematicas
Paginas de matematicasPaginas de matematicas
Paginas de matematicas
 

Similaire à Aprendizaje Refuerzo

Similaire à Aprendizaje Refuerzo (11)

Capitulo 9
Capitulo 9Capitulo 9
Capitulo 9
 
Cadenas de markov 1
Cadenas de markov 1Cadenas de markov 1
Cadenas de markov 1
 
Estudio sobre el pronóstico de la tendencia del mercado de valores basado en ...
Estudio sobre el pronóstico de la tendencia del mercado de valores basado en ...Estudio sobre el pronóstico de la tendencia del mercado de valores basado en ...
Estudio sobre el pronóstico de la tendencia del mercado de valores basado en ...
 
Procesos estocasticos blog
Procesos estocasticos blogProcesos estocasticos blog
Procesos estocasticos blog
 
Busqueda de epacio de estado 1
Busqueda de epacio de estado 1Busqueda de epacio de estado 1
Busqueda de epacio de estado 1
 
Cadenas de markov investigacion de operaciones
Cadenas de markov investigacion de operacionesCadenas de markov investigacion de operaciones
Cadenas de markov investigacion de operaciones
 
markov (2).pdf
markov (2).pdfmarkov (2).pdf
markov (2).pdf
 
Clase 2
Clase 2Clase 2
Clase 2
 
Programacion Dinamica Intro
Programacion Dinamica IntroProgramacion Dinamica Intro
Programacion Dinamica Intro
 
Part 11
Part 11Part 11
Part 11
 
Ca 2013 f_01
Ca 2013 f_01Ca 2013 f_01
Ca 2013 f_01
 

Aprendizaje Refuerzo