안녕하세요. RL korea에서 "GAIL하자!" 라는 프로젝트를 진행했던 프로젝트 매니저 이동민이라고 합니다. 이 자료는 저희가 4개월동안 진행했던 과정들을 간략하게 소개하는 자료입니다.
저희 프로젝트는 Imitation Learning의 방법 중 하나인 "Inverse RL"에 대한 논문들의 이론적 바탕을 이해하고 이를 환경에 구현해보는 프로젝트를 진행하였습니다.
관련 논문 리스트는 다음과 같습니다.
[1] AY. Ng, et al., "Algorithms for Inverse Reinforcement Learning", ICML 2000.
[2] P. Abbeel, et al., "Apprenticeship Learning via Inverse Reinforcement Learning", ICML 2004.
[3] ND. Ratliff, et al., "Maximum Margin Planning", ICML 2006.
[4] BD. Ziebart, et al., "Maximum Entropy Inverse Reinforcement Learning", AAAI 2008.
[5] J. Ho, et al., "Generative Adversarial Imitation Learning", NIPS 2016.
[6] XB. Peng, et al., "Variational Discriminator Bottleneck. Improving Imitation Learning, Inverse RL, and GANs by Constraining Information Flow", ICLR 2019.
프로젝트 결과로는 논문을 정리한 블로그와 논문을 구현한 Github가 있습니다. 링크는 다음과 같습니다.
- 블로그 : https://reinforcement-learning-kr.github.io/2019/01/22/0_lets-do-irl-guide/
- Github : https://github.com/reinforcement-learning-kr/lets-do-irl
우리 모두 함께 IRL해요!
감사합니다 :)
안녕하세요.
RL Korea에서 피지여행 프로젝트에 참여한 이동민입니다.
이 자료는 8월 25일 토요일에 제 1회 RLKorea 프로젝트 세미나에서 발표한 자료입니다. 아쉽게도 영상은 실행되지 않습니다.
세미나 링크는 아래와 같습니다.
제 1회 RLKorea 프로젝트 세미나 : https://www.facebook.com/groups/ReinforcementLearningKR/permalink/2024537701118793/?__tn__=H-R
피지여행을 간략하게 소개해드리자면, Policy Gradient와 관련된 논문들을 리뷰하여 블로그 정리하고 & 코드를 구현하여 실험하는 프로젝트입니다.
블로그와 깃허브는 다음과 같습니다.
정리 블로그 : https://reinforcement-learning-kr.github.io/…/0_pg-travel-…/
구현 깃허브 : https://github.com/reinforcement-learning-kr/pg_travel
많은 분들이 보시고 도움이 되었으면 좋겠습니다!
감사합니다~~!!!
Artikel Ferenc Postma over Briefe von Stephanus Bányai an Prof. Valckenaer in Franeker, 1742-1760. In de Friese universiteitsstad studeerden vele Hongaren.
안녕하세요. RL korea에서 "GAIL하자!" 라는 프로젝트를 진행했던 프로젝트 매니저 이동민이라고 합니다. 이 자료는 저희가 4개월동안 진행했던 과정들을 간략하게 소개하는 자료입니다.
저희 프로젝트는 Imitation Learning의 방법 중 하나인 "Inverse RL"에 대한 논문들의 이론적 바탕을 이해하고 이를 환경에 구현해보는 프로젝트를 진행하였습니다.
관련 논문 리스트는 다음과 같습니다.
[1] AY. Ng, et al., "Algorithms for Inverse Reinforcement Learning", ICML 2000.
[2] P. Abbeel, et al., "Apprenticeship Learning via Inverse Reinforcement Learning", ICML 2004.
[3] ND. Ratliff, et al., "Maximum Margin Planning", ICML 2006.
[4] BD. Ziebart, et al., "Maximum Entropy Inverse Reinforcement Learning", AAAI 2008.
[5] J. Ho, et al., "Generative Adversarial Imitation Learning", NIPS 2016.
[6] XB. Peng, et al., "Variational Discriminator Bottleneck. Improving Imitation Learning, Inverse RL, and GANs by Constraining Information Flow", ICLR 2019.
프로젝트 결과로는 논문을 정리한 블로그와 논문을 구현한 Github가 있습니다. 링크는 다음과 같습니다.
- 블로그 : https://reinforcement-learning-kr.github.io/2019/01/22/0_lets-do-irl-guide/
- Github : https://github.com/reinforcement-learning-kr/lets-do-irl
우리 모두 함께 IRL해요!
감사합니다 :)
안녕하세요.
RL Korea에서 피지여행 프로젝트에 참여한 이동민입니다.
이 자료는 8월 25일 토요일에 제 1회 RLKorea 프로젝트 세미나에서 발표한 자료입니다. 아쉽게도 영상은 실행되지 않습니다.
세미나 링크는 아래와 같습니다.
제 1회 RLKorea 프로젝트 세미나 : https://www.facebook.com/groups/ReinforcementLearningKR/permalink/2024537701118793/?__tn__=H-R
피지여행을 간략하게 소개해드리자면, Policy Gradient와 관련된 논문들을 리뷰하여 블로그 정리하고 & 코드를 구현하여 실험하는 프로젝트입니다.
블로그와 깃허브는 다음과 같습니다.
정리 블로그 : https://reinforcement-learning-kr.github.io/…/0_pg-travel-…/
구현 깃허브 : https://github.com/reinforcement-learning-kr/pg_travel
많은 분들이 보시고 도움이 되었으면 좋겠습니다!
감사합니다~~!!!
Artikel Ferenc Postma over Briefe von Stephanus Bányai an Prof. Valckenaer in Franeker, 1742-1760. In de Friese universiteitsstad studeerden vele Hongaren.
2. {s
$
F
o'a
5
t
o
e
=oL
E
$
{}
:EI
$)
()
L
F
$
a)
c) (f
(l} c!
=q)(}=
n- :f
()-.$ (a
3o.a)ET]([
#ll
U)fir
odi'5'
:E
L$(Jr
-!i L)
(D r-
U}
0)
$
$(}
a
g
{t)
ro
'o
c
t$
U
J
-g
{J
.a)
Lo
d
-LJ
a)
G
O
bo
"ot*
ql
"+
qr
:€J
*-
fi-
$.{")
.:
rd
c
c{
_q)
'5
"a
(r)
c)
={$
.g
:l
(]
cf)
J-i)
4
()
co.E
(J
{
(-J
$
$
TJ
c
N
.€
(J
(R
t_
=G}
rs
EL
O
tn
q)
C
o
EL
O
{g
a
"(u
TJ
:f(l)
rj(l)
(g
:*
EU
&
we#
b@
M@
d
wd
ffi
w
ffir*fr
@
ffi
ffif:"*:1
W
Mw
4ffiW
M
ffi
7^q
Jl-{
Ft
A
F{
F-{
UF(
Fr
&
A
lrE
trl,a
l-t
F-
U
-
rl-t
F.
ftF*{
FC
TJ
:P
;ed
h#
w"
is{
tdd
e
U
4p
k**
q
*P
F
h
Jta
*
nl*
Flit
{lff
kfi
3*P
b,o
H.stLt!
E
? bH-t t >
E ;:
s. Bg
es$ ;t-
Fg)o
o
t
r$
UT
c)
o(r3
o
'6
5
ro
L
o
g
L*_
3. 7
It
ffiffi@ffiF$$
ffiI,H Tffimmffiil:ilflffitft:rw
ACF France - Mission au TCHAD
GERTIFICAT DE TRAVAIL
Je soussign6e ERIC BESSE agissant en qualit6 de Coordinateur Terrain d Action Contre la
Faim France - Mission Tchad, atteste que :
Monsieur MBAITESSEM MAIRO, a travaill6 pour le compte de l'association ACF du 11
Mars au 31 Ao0t 2013 en qualit6 de : Chef d'Equipe Agriculture et Elevage d Moussoro.
A compter de ce jour, il est libre de tout engagement.
En foi de quoi le pr6sent certificat lui est d6livr6 pour servir et valoir ce que de droit.
A Moussoro le 31 Ao0t 2013
Fait en 2 exemplaires originaux, dont un pour chacune des parties.
Pour L'employeur,
ERIC BESSE
Coordinateur Terrain
ACF --Mission Tchad