standard scaler 의 fit_transform 과 transform 차이

2022.11.30 21:58 1,342 조회

안녕하세요, vanilla code를 살펴보니..

Train data는 fit_transform 시키고

validation Data는 transform 시키는데 두 데이터의 전처리를 다른 방식으로 수행하는 이유를 아시는분이 있을까요?


감사합니다.


로그인이 필요합니다
0 / 1000
파이썬초보만
2022.11.30 22:55

제가 아는선에서는 
실제 맞춰야하는 문제인 test data에 대해서는 fit_transform을 수행할 수 없습니다.
validation은 test data를 예측하기 위해 수행하기때문에, test환경과 거의 동일하게 진행해야 합니다. 
validation에 fit_transform을 하게된다면 validation에서는 성능이 좋을 수 있지만 실제 test data에는 성능이 나쁠 가능성이 큽니다.

한번삶은느낌
2022.12.05 08:15

감사합니다