LLM_딥러닝 모델

카테고리 없음

LLM_딥러닝 모델

멍주다배 2025. 2. 4.

모델구조학습 방식주요 특징

MLP	다층 퍼셉트론	역전파(Backpropagation)	입력값 간 순서를 고려하지 않음
DNN	깊은 신경망	역전파	복잡한 데이터 처리 가능
RNN	순환 신경망	시간축 학습(시퀀스)	순서가 중요한 데이터 처리 가능

ANN (Artificial Neural Network)

인공신경망(ANN)은 인간의 신경망을 모방한 기계 학습 모델.
퍼셉트론과 MLP가 ANN의 기본 구조를 이룸.

DNN (Deep Neural Network)

MLP를 확장하여 은닉층을 깊게 쌓은 신경망을 DNN이라고 함.
특징 추출과 복잡한 패턴 학습이 가능하지만, 학습이 어려운 문제(Vanishing Gradient) 발생.

RNN (Recurrent Neural Network)

Recurrent: 이전의 결과를 다음 입력에 반영
- 과거 데이터를 기억해 문맥(Context) 을 유지

h: 은닉 상태, f: 활성화 함수, W: 가중치, x: 입력 데이터

시퀀스 데이터를 처리하는 신경망
- 은닉층의 출력을 다시 입력으로 사용하는 구조를 가짐 → 순차적 데이터(텍스트, 음성) 분석 가능
장기 의존성 문제 발생
- 기울기 소실(Vanishing Gradient): 문장이 길어질수록 과거 정보가 사라짐
- 기울기 폭주(Exploding Gradient): 기울기가 점차 커져 가중치들이 비정상적으로 큰 값이 되면서 결국 발산하는 경우
- 이를 해결하기 위해 LSTM(Long Short-Term Memory), GRU(Gated Recurrent Unit) 같은 구조가 개발됨

현재글LLM_딥러닝 모델

mung_TIL

dataframe, 이상치, dl, Django, ML, sum(), 샘플링, comprehesions, merge, LLM, data preprocessing, python, in, GIT, 인코딩, sql, Conflict, collection data types, NumPy, 결측치,

Today :
Yesterday :

티스토리툴바