인공지능 개발자 수다(유튜브 바로가기) 자세히보기

Machine Learning

데이터 스케일링 (Data Scaling)

Suda_777 2023. 6. 7. 10:53

목차

    반응형

    구구절절 설명을 늘어놓는 것 보다는

    간단하게 수식만 정리하는 것이, 가장 명확한 설명이 될 수 있겠죠^^?

    1. Standard Scaler

    $$ z = \frac{x - \mu}{\sigma} $$

     

    2. MinMax Scaler

    $$ z = \frac{x - min}{max - max} $$

    3. MaxAbs Scaler

    $$ z = \frac{x}{max\_abs} $$

    4. Robust Scaler

    - Q1: 1사분위수

    - Q2: 중앙값(median)

    - Q3: 3사분위수

    $$ z = \frac{x-Q2}{Q3-Q1} $$

     

     

    5. Normalizer

    코드

    ```python

    class sklearn.preprocessing.Normalizer(norm='l2', *, copy=True)

    ```

    1) L1 수식

    $$ z = \frac{x}{||x||_1} $$

    - ||x|| : 샘플 x의 특성 값의 절댓값의 합입니다.

     

    2) L2 수식

    $$ z = \frac{x}{||x||_2} $$

    - ||x|| : 샘플 x의 특성 값의 제곱의 합의 제곱근 입니다.

     

    반응형

    'Machine Learning' 카테고리의 다른 글

    [Logistic Regression] 설명과 실습  (1) 2021.05.12
    [LightGBM] 설명 및 장단점  (2) 2021.04.27