시계열 데이터 처리를 위한 RNN 완벽 가이드 - LSTM 모델

2022. 3. 21. 00:34·프로젝트/코드프레소 체험단

LSTM(Long Short Term Memory)

 - RNN 모델의 장기의존성 문제를 해결하기 위한 방안

 - 기존 RNN 모델의 입출력이 각각 2개 였지만, LSTM을 추가하며 입출력이 각각 3개가 되었다.

 - 오래 가져가야하는 정보는 가져가고, 짧게 가져가야하는 정보는 뺀다.(컨베이어 벨트)

LSTM

 

 

LSTM 상세 구조

 - LSTM(Long Short Term Memory)의 핵심 아이디어: Cell State

 - Cell state는 모델에 있어서 컨베이어 벨트와 같은 역할

 - 각 step별로 입력되는 데이터와 달리, 모델의 전체 step에 걸쳐 정보 전달

 - Forget gate, Input gate, 

 

 

Forget gate

 - 해당 step(t)에 입력된 데이터([h(t-1), X(t)] 중 잊어버려야 하는 정보 선정

Forget gate

 

 

Input gate

 - 해당 step(t)에 입력된 데이터([h(t-1), X(t)] 중 중요한 정보 선정

Input gate

 

 

Output gate

 - Forget gate와 Input gate를 거친 Cell State와 해당 step에 입력된 데이터([h(t-1), X(t)]를 분석하여, 다음 step으로 전달한 context(h(t)) 생성

Output gate

 

 

Tensorflow 2.0 에서의 LSTM

 - units: 퍼셉트론의 개수

 - activation: 활성화 함수

 - recurrent_activation: gate값들에 적용할 활성화 함수

 - return_sequences: 매 step마다 h값을 output할 지 정하는 boolean

 - return_stae: 분석이 끝난 후, state를 추가적으로 반환할 지 정하는 boolean

tf.keras.layers.LSTM(
	units, activation='tanh', recurrent_activation='sigmoid',
    return_sequences=False, return_state=False,
    **kwargs
)

 

 

 

'프로젝트 > 코드프레소 체험단' 카테고리의 다른 글

시계열 데이터 처리를 위한 RNN 완벽 가이드 - LSTM 모델을 이용한 영화리뷰 데이터셋 분류 모델 구현  (0) 2022.03.26
시계열 데이터 처리를 위한 RNN 완벽 가이드 - GRU 모델  (0) 2022.03.24
시계열 데이터 처리를 위한 RNN 완벽 가이드 - RNN 모델의 한계와 장기의존성 문제  (0) 2022.03.21
시계열 데이터 처리를 위한 RNN 완벽 가이드 - 영화리뷰 데이터셋 분류 모델 구현  (0) 2022.03.20
시계열 데이터 처리를 위한 RNN 완벽 가이드 - Keras의 SimpleRNN API  (0) 2022.03.16
'프로젝트/코드프레소 체험단' 카테고리의 다른 글
  • 시계열 데이터 처리를 위한 RNN 완벽 가이드 - LSTM 모델을 이용한 영화리뷰 데이터셋 분류 모델 구현
  • 시계열 데이터 처리를 위한 RNN 완벽 가이드 - GRU 모델
  • 시계열 데이터 처리를 위한 RNN 완벽 가이드 - RNN 모델의 한계와 장기의존성 문제
  • 시계열 데이터 처리를 위한 RNN 완벽 가이드 - 영화리뷰 데이터셋 분류 모델 구현
KimCookieYa
KimCookieYa
무엇이 나를 살아있게 만드는가
  • KimCookieYa
    쿠키의 주저리
    KimCookieYa
  • 전체
    오늘
    어제
    • 분류 전체보기 (576)
      • 혼잣말 (88)
      • TIL (3)
      • 커리어 (24)
        • Sendy (21)
        • 외부활동 기록 (2)
      • 프로젝트 (186)
        • 티스토리 API (5)
        • 코드프레소 체험단 (89)
        • Web3 (3)
        • Pint OS (16)
        • 나만무 (14)
        • 대회 (6)
        • 정글 FE 스터디 (16)
        • MailBadara (12)
        • github.io (1)
        • 인공지능 동아리, AID (5)
        • 졸업과제 (18)
        • OSSCA 2024 (1)
      • 크래프톤 정글 2기 (80)
      • IT (169)
        • 코딩 (4)
        • CS (18)
        • 에러 (5)
        • 블록체인 (23)
        • Front-End (40)
        • 알고리즘&자료구조 정리 (3)
        • 코딩테스트 (3)
        • BOJ 문제정리 (41)
        • WILT (12)
        • ML-Agents (4)
        • 강화학습 (1)
        • Android (0)
        • LLM (2)
      • 전공 (1)
        • 머신러닝 (1)
      • 자기계발 (20)
        • 빡공단X베어유 (2)
        • 독서 (15)
  • 블로그 메뉴

    • 홈
    • 방명록
    • Github
    • Velog
    • 관리
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    RNN
    docker
    나만무
    리액트
    니어프로토콜
    글리치해커톤
    코드프레소
    pintos
    블록체인
    JavaScript
    사이드프로젝트
    NEAR Protocol
    자바스크립트
    핀토스
    MailBadara
    크래프톤정글
    파이썬
    부산대
    OS
    머신러닝
    numpy
    프로그래머스
    Pint OS
    딥러닝
    알고리즘
    해커톤
    Flutter
    react
    센디
    졸업과제
  • hELLO· Designed By정상우.v4.10.3
KimCookieYa
시계열 데이터 처리를 위한 RNN 완벽 가이드 - LSTM 모델
상단으로

티스토리툴바