인공지능 개발자 수다(유튜브 바로가기) 자세히보기
반응형

Machine Learning 3

데이터 스케일링 (Data Scaling)

구구절절 설명을 늘어놓는 것 보다는 간단하게 수식만 정리하는 것이, 가장 명확한 설명이 될 수 있겠죠^^? 1. Standard Scaler $$ z = \frac{x - \mu}{\sigma} $$ 2. MinMax Scaler $$ z = \frac{x - min}{max - max} $$ 3. MaxAbs Scaler $$ z = \frac{x}{max\_abs} $$ 4. Robust Scaler - Q1: 1사분위수 - Q2: 중앙값(median) - Q3: 3사분위수 $$ z = \frac{x-Q2}{Q3-Q1} $$ 5. Normalizer 코드 ```python class sklearn.preprocessing.Normalizer(norm='l2', *, copy=True) ``` 1) L..

Machine Learning 2023.06.07

[Logistic Regression] 설명과 실습

In [5]: import numpy as np from sklearn.datasets import make_classification import statsmodels as sm from statsmodels.discrete.discrete_model import Logit from scipy import stats import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sns 1. 이론¶ 1.1. Logistic Regression 언제 사용하는가? 독립변수가 연속형 데이터 (수치) 독립변수 범위: $-\infty$ ~ $\infty$ 종속변수가 Binary (0 or 1로 표현 할 수 있는 데이터 일 때) 예: 남/여, ..

Machine Learning 2021.05.12

[LightGBM] 설명 및 장단점

lightGBM 1. 장점 Light GBM은 말 그대로 “Light” 가벼운 것인데요, 왜냐면 속도가 빠르기 때문입니다. Light GBM은 큰 사이즈의 데이터를 다룰 수 있고 실행시킬 때 적은 메모리를 차지합니다. Light GBM이 인기있는 또 다른 이유는 바로 결과의 정확도에 초점을 맞추기 때문입니다. LGBM은 또한 GPU 학습을 지원하기 때문에 데이터 사이언티스트가 데이터 분석 어플리케이션을 개발할 때 LGBM을 폭넓게 사용하고 있습니다. 2. 권장 데이터 수 LGBM을 작은 데이터 세트에 사용하는 것은 추천되지 않습니다. Light GBM은 overfitting (과적합)에 민감하고 작은 데이터에 대해서 과적합하기 쉽습니다. row (행) 수에 대한 제한은 없지만 제 경험상 10,000 이상..

Machine Learning 2021.04.27
반응형