카테고리 없음

LLM_딥러닝 모델

멍주다배 2025. 2. 4.

 

모델구조학습 방식주요 특징

MLP 다층 퍼셉트론 역전파(Backpropagation) 입력값 간 순서를 고려하지 않음
DNN 깊은 신경망 역전파 복잡한 데이터 처리 가능
RNN 순환 신경망 시간축 학습(시퀀스) 순서가 중요한 데이터 처리 가능

 

ANN (Artificial Neural Network)

  • 인공신경망(ANN)은 인간의 신경망을 모방한 기계 학습 모델.
  • 퍼셉트론과 MLP가 ANN의 기본 구조를 이룸.

 

DNN (Deep Neural Network)

  • MLP를 확장하여 은닉층을 깊게 쌓은 신경망을 DNN이라고 함.
  • 특징 추출과 복잡한 패턴 학습이 가능하지만, 학습이 어려운 문제(Vanishing Gradient) 발생.

 

RNN (Recurrent Neural Network)

  • Recurrent: 이전의 결과를 다음 입력에 반영
    • 과거 데이터를 기억해 문맥(Context) 을 유지

 

  • h: 은닉 상태, f: 활성화 함수, W: 가중치, x: 입력 데이터

 

  • 시퀀스 데이터를 처리하는 신경망
    • 은닉층의 출력을 다시 입력으로 사용하는 구조를 가짐 → 순차적 데이터(텍스트, 음성) 분석 가능
  • 장기 의존성 문제 발생
    • 기울기 소실(Vanishing Gradient): 문장이 길어질수록 과거 정보가 사라짐
    • 기울기 폭주(Exploding Gradient): 기울기가 점차 커져 가중치들이 비정상적으로 큰 값이 되면서 결국 발산하는 경우
    • 이를 해결하기 위해 LSTM(Long Short-Term Memory), GRU(Gated Recurrent Unit) 같은 구조가 개발됨