Post

RNN

Summary of Bayesian Networks and Hidden Markov Models

RNN

RNN

RNN architecture

RNN 기본 아이디어

RNN 은 Sequence Data(time series, text, speech 등)을 처리하기 위해 설계됨.

현재 시점의 output은

  • 현재 입력,
  • 이전 시점의 hidden state

를 함께 사용해서 계산됨. 그래서 RNN 은 memory 를 가진다고 표현함.

RNN equation

Update hidden state

\[h_t = \phi(W_x x_t + W_h h_{t-1} + b)\]
  • \(x_t\) : 현재 시점 입력
  • \(h_{t-1}\) : hidden state of previous time
  • \(h_t\) : hidden state of present
  • \(W_x, W_h\): Weight matrix
  • \(b\) : bias
  • \(\phi(\cdot)\) : non linear function (ex, \(tanh\) , \(ReLU\) etc)
This post is licensed under CC BY 4.0 by PythonToGo .