안녕하세요. 이동민입니다. :)
2018. 8. 9일에 한국항공우주연구원에서 발표한 "Safe Reinforcement Learning" 발표 자료입니다.
목차는 다음과 같습니다.
1. Reinforcement Learning
2. Safe Reinforcement Learning
3. Optimization Criterion
4. Exploration Process
강화학습 계속 공부하면서 실제로 많은 분들이 쓸 수 있게 하려면 더 안전하고 빨라야한다는 생각이 들었습니다. 그래서 이에 관련하여 논문과 각종 자료들로 공부하여 발표하였습니다.
많은 분들께 도움이 되었으면 좋겠습니다. 감사합니다!
2. d
• m S rS
• 7 K a
. h i Ob 7P
, N . O y eo P
, N . O AEGB I AFAG 7A IGEGC. G G I K E GP
LIE AG E I K G G G IAL 4 0 I
, - N . ug !
• 7 69 2 wn ~ t
2 839 12 f ::9 w R c a
162. :CDCNC ACO
1CCM :CG DLNAC C P 5C N G 1LCO P LNH CP IL 5G H
0L MNC C OGRC NRCT L DC :CG DLNAC C P 5C N G ( ' 9 MCN 5G H
N OP :C GL 9LIGAT 8MPG G PGL ( ' 9 MCN 5G H
:98 N OP :C GL 9LIGAT 8MPG G PGL - 4 BCMP :COC NA 9 MCN :CRGCS L C 5G H
I LNGP O DLN 4 RCNOC :CG DLNAC C P 5C N G ( 9 MCN 5G H
MMNC PGACO GM 5C N G RG 4 RCNOC :CG DLNAC C P 5C N G ( ) 9 MCN 5G H
9: (,- MMNC PGACO GM 5C N G RG 4 RCNOC :CG DLNAC C P 5C N G 99 5G H
DC IPG C P :CG DLNAC C P 5C N G DLN PL L L O 1NGRG 99 5G H
4 PNLB APGL LD 4 RCNOC :CG DLNAC C P 5C N G 99 5G H
4 RCNOC :CG DLNAC C P 5C N G OCB L 0NGPGA I P PC L C 5G H
4 GP PGL 5C N G DLN 8 NL LP OG 4 PC L C 5G H
:L LP IC N O PL MI T P IC PC GO T G GP PGL L C 5G H
422: 9 ( ' - 1CCM G GA M MCN O MMIC C P NT RGBCL L C 5G H