[Python / ML] sklearn 라이브러리를 이용한 scaling

2022. 10. 8. 20:11

스케일링 하는 이유

데이터간 범위가 다르다면 머신이 동작하면서 오류값이 가장 낮은 곳으로 수렴하는 과정에서 속도 차이가 발생
예를 들어 나이, 몸무게, 키 데이터가 있다면 나이와 몸무게는 키 데이터보다 숫자가 작아서 오류 역전파 과정에서 가중치가 크게 변하지 않음 하지만 키 데이터는 숫자가 커서 크게 변함..
이를 해결하기 위해 모든 데이터들의 범위를 똑같이 맞춰주는 과정이 scaling
분포의 모양을 바꾸는것은 아니다.

1. Min - Max Scaling

2. Standard Scaling

[ Python / ML ] Pandas 데이터 타입 확인 및 구분하기 (0)	2022.10.13
[Python / ML] 데이터 인코딩 (0)	2022.10.08
[Python / ML] 데이터의 결측치 처리 방법 (0)	2022.10.08
[Python / ML] 자주 쓰이는 Numpy와 Pandas 문법 (0)	2022.10.07
[Python] Numpy와 Pandas 왜 둘 다 배워..? (0)	2022.10.05

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

음기의 공부노트