RNN의 한계(장기의존성 문제 Long-term dependency)
- 입력 데이터의 step이 길어질 경우, context에서 앞선 입력 데이터의 정보가 희미해지는 현상
- 근본적으로 Gradient Vanishing과 동일한 문제
- 입력 데이터의 step이 길어질수록 Fully Connected Layer를 깊게 쌓는 것과 동일한 문제 발생
장기의존성 예제
- Beverage from the Starbuck(스타벅스에서 파는 커피): 문장이 짧기 때문에, 스타벅스에서 커피를 예측할 수 있다.
- I was born in Korea, my name is Cheol_Soo Kim, my height is 180, my weight is 80 kg, and I speak in my native language.(나는 한국에서 태어났으며, 이름은 김철수이고, 키는 180이며, 몸무게는 80킬로이고, 모국어로 말을 한다.): 문자이 길기 때문에, 한국에서 모국어인 한국어를 예측하기 힘들다.
장기의존성을 해결하기 위한 방안
- LSTM
- GRU
'프로젝트 > 코드프레소 체험단' 카테고리의 다른 글
시계열 데이터 처리를 위한 RNN 완벽 가이드 - GRU 모델 (0) | 2022.03.24 |
---|---|
시계열 데이터 처리를 위한 RNN 완벽 가이드 - LSTM 모델 (0) | 2022.03.21 |
시계열 데이터 처리를 위한 RNN 완벽 가이드 - 영화리뷰 데이터셋 분류 모델 구현 (0) | 2022.03.20 |
시계열 데이터 처리를 위한 RNN 완벽 가이드 - Keras의 SimpleRNN API (0) | 2022.03.16 |
시계열 데이터 처리를 위한 RNN 완벽 가이드 - RNN 모델 (0) | 2022.03.16 |