Introduction
• Evaluate two Gated RNN-based models(LSTM, GRU) + tanh-RNN
• 본 논문에서는 polyphonic music, speech signal modeling dataset을 사용하여
실험을 진행하였으나 NLP에서의 활용사례를 중심으로 설명
Methodology
• LSTM
i : input gate, Whether to write to cell
f : forget gate, whether to erase cell
o :output gate, how much to reveal cell
g :gate gate, how much to write to cell
Sigmoid 통과한 0~1값
Tanh 통과한 -1~1값
Methodology
• LSTM
-output gate
• 은닉 상태를 결정하는 일에 쓰임, hidden state의 입력으로 들어감
• 앞에서 구한 cell state 값을 tanh에 넣어서 -1~1사이 값이 되고 출력 게이트와 곱해지면서 filtering역할 하게 됨
Methodology
• GRU • Cell state vector와 hidden state vector를 일원화함
• Reset gate -> 이전의 hidden state를 얼마나 제외할 지 결정
• Forget gate 대신 (1-input gate) 사용 –> 합쳐서 update gate
Update gate
Reset gate