코딩하는 애옹😸

(AI Math 10강) RNN 본문

부스트캠프 AI Tech 3기/Study

(AI Math 10강) RNN

DevYe 2022. 1. 21. 00:24
728x90
반응형

RNN

시퀀스(sequence) 데이터 : 소리, 문자열 주가 등 시점별로 나타나는 것, 순서를 바꾸거나 과거 정보에 손실이 발생하면 데이터의 확률분포도 바뀜
시퀀스 데이터를 다루는 방법 : 조건부 확률 이용
X1...Xt1 까지의 정보가 조건부로 주어진 상황에서 Xt를 모델링하는 조건부 확률 분포

  • XtP(Xt|Xt1,...,X1)
  • 모든 과거 정보가 필요한 것은 아니다
  • 조건부의 들어가는 데이터는 가변적

AR(τ) 모델

자기회귀모델(Autoregressive Model) : 고정된 길이 τ만큼의 시퀀스만 사용

잠재 AR 모델

직전 정보 Xt1와 직전이 아닌 정보들인 잠재변수 Ht로 인코딩

  • 가변적인 데이터를 고정된 길이의 문제로 바꿀 수 있음
  • Ht : 과거 바로 이전의 데이터 Xt1와 이전 잠재변수 Ht1

RNN 이해하기

이전 순서의 잠재변수와 현재의 입력을 활용

순전파

  • 입력으로부터 전달하게 되는 Wt와 이전 잠재변수로부터 정보를 전달받게되는 WH를 새로 만들게 됨
  • Ht : 현재 들어온 Xt와 이전 시점의 Ht1을 받아서 만듦
  • Ht를 다음 시점에도 이용
  • 가중치 행렬 Wt에 따라서 변하지 않음

역전파 BPTT(Backpropagation Through Time)


잠재변수에 출력값다음 시점에서의 잠재변수가 들어옴

  • 시퀀스의 길이가 길어질수록 알고리즘의 계산이 불안정하므로 길이를 끊어야 함
  • -> truncate BPTT
  • 위와 같은 문제를 해결하기 위해 등장한 네트워크 : LSTM, GRU
반응형

'부스트캠프 AI Tech 3기 > Study' 카테고리의 다른 글

[PyTorch] Basics  (0) 2022.01.25
[예제] BackPropagation  (0) 2022.01.23
(AI Math 9강) CNN  (0) 2022.01.21
(AI Math 8강) 베이즈 통계학  (0) 2022.01.20
(AI Math 7강) 통계학 맛보기  (0) 2022.01.20
Comments