인공지능 개발자 수다

인공지능 개발자 수다(유튜브 바로가기) 자세히보기

Deep Learning/Deep Learning 개념

[Deep Learning] Overfitting 문제 해결

Suda_777 2021. 5. 22. 00:14

목차

1. 개요

딥러닝 학습시 OverFitting을 해결하기 위한 다양한 방법에 대해 공부해보자

2. Overfitting 이란

모델이 데이터에 과하게 맞추게 되어, 앞으로 들어올 데이터는 맞지 않도록 학습된 형태
Test 데이터 셋의 Loss값은 작지만, Validation 데이터 셋의 Loss값이 커질때

3. 해결방법

개념
- Overfitting을 해결하기 위해서는 일반적으로 모델의 복잡성을 줄이도록 해야 한다.
- Regularization 기법

3.1. Early Stopping

학습을 중간에 중단
Validation과 Test의 Loss를 모니터링해서 중단 시점을 정함

3.2. Weight decay

3.2.1. L1 Regularization

수식

$$ E(w) = E(w) + \frac{\lambda}{2}|w| $$

설명
- E(w) 는 Lossfunction이다
- w값들을 모두 더하는 수식을 더하기 때문에 w값들이 작아지는 방향으로 학습
- Input 값들을 고를때 주로 사용 (0.00001와 0.9을 비교하지 않고 더해서 작아지기만 하면 됨)

3.2.2. L2 Regularization

수식

$$ E(w) = E(w) + \frac{\lambda}{2} w^{T}w $$

설명
- E(w) 는 Lossfunction이다
- w의 제곱들을 모두 더하는 수식을 더하기 때문에 w값들이 작아지는 방향으로 학습
- 제곱이 들어가기 때문에 튀는 값이 있으면 차이가 커짐 (0.00001 제곱과 0.9의 제곱을 비교했을 때 0.9가 너무 커짐), 튀는 값이 없도록 학습
- 주로 학습할때 사용
결론
- w값이 0이 된 것들은 Connection을 끊어 버린다는 뜻
- 모델이 단순화 됨

3.3. Dropout

불균등 학습에 대한 해결을 제시함
- 학습을 잘 되는 노드와 안되는 노드가 있기 때문
Test 할때의 계산 방법
- Train 할 때는 Dropout을 하지만 Test 할 때는 모든 값을 다 사용하기 때문에 Node에 들어오는 값이 더 커지게 되는 문제가 발생
- Test를 할 때는 Dropout으로 인해 작아진 비율만큼 곱해줘야함.
주의할 점
- 데이터가 적을 때는 사용하지 않는 것이 좋음
- 학습을 더 여러번 진행해야 함 (학습이 느려짐)
참고
- Weight Decay 방법과 함께 사용하면 좋음

저작자표시 비영리 변경금지 (새창열림)

'Deep Learning > Deep Learning 개념' 카테고리의 다른 글

활성화 함수 (0)	2022.07.03
딥러닝 옵티마이저 (Optimizer) 종류와 설명 (0)	2021.05.03

현재글[Deep Learning] Overfitting 문제 해결

댓글

티스토리툴바