본문 바로가기

부스트캠프 AI Tech/Deep Learning

RNN

딸기스무디 2022. 2. 8. 15:56

Recurrent Neural Network

markov model (first-order autogressive model) : n번째의 결과는 n-1에 dependent하고 그 이전 정보는 버린다
latent autoregressive model : 과거의 정보를 요약한 hidden state만을 참조
Short-term dependency - 과거의 정보를 제대로 저장할 수 없음
Gradient vanishing/exploding

LSTM (Long Short Term Memory)

cell state : t까지의 정보를 summarize
Forget gate : 어떤 정보를 버릴지 (input과 prev hidden state에 대해)
Input gate : 어떤 정보를 저장할지 (input과 prev hidden state에 대해)
Update cell : Input gate의 결과와 Forget gate의 결과를 combine하여 cell state update
Output gate : 어떤 값을 hidden state와 output으로 던져줄지
cell state dimension = output dimension

GRU (Gated Recurrent Unit)

reset gate, update gate로만 구성
cell state가 사라지고 hidden state만 남음
hidden state가 output이자 곧 다음 step의 hidden state로 들어감
lstm보다 적은 paramete

'부스트캠프 AI Tech > Deep Learning' 카테고리의 다른 글

Generative Model (0)	2022.02.08
Transformer (0)	2022.02.08
CV application (0)	2022.02.08
Modern CNN (0)	2022.02.08
Optimizer (0)	2022.02.07

티스토리툴바