Python 튜토리얼

Lv4 전처리 2/9 python 파이썬 다중공선성 해결 - 변수 제거

2021.08.11 10:05 6,078 조회

다중공선성 해결

안녕하세요. 이전 시간에 다중공선성을 해결하는 3가지 방법에 대하여 알려드렸고, 그 중 첫번째 방법인 변수 정규화에 대해 실습해 보았습니다.

이번 시간에는 두번째 방법인 VIF 기준 10이상의 변수들을 제거해 보도록 하겠습니다.


--------------------------------------------------------------------------------------------------------------------------------------------

# train 데이터의 VIF 계수 출력


vif = pd.DataFrame()

vif["VIF Factor"] = [variance_inflation_factor(train.values, i) for i in range(train.shape[1])]

vif["features"] = train.columns 

vif


# 종속변수인 quality를 제외 한 vif 10이상 변수 제거


new_train = train.drop(['alcohol','fixed acidity','total sulfur dioxide','density','pH','sulphates'],axis=1)


# VIF 10이상의 변수 제거 후 VIF 다시 확인


new_train_df =  pd.DataFrame(new_train)

new_train_df.columns = new_train.columns


vif = pd.DataFrame()

vif["VIF Factor"] = [variance_inflation_factor(new_train_df.values, i) for i in range(new_train_df.shape[1])]

vif["features"] = new_train_df.columns 

vif

--------------------------------------------------------------------------------------------------------------------------------------------

[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #MinMaxScailing

로그인이 필요합니다
0 / 1000
그린티
2021.09.12 12:38

done

다욤
2021.09.19 18:10

done

Holte
2021.10.06 21:43

왼쪽눈썹왁싱
2021.11.01 17:36

changhyeon
2021.12.29 14:44

done

moran
2022.01.03 16:09

dbnoid
2022.01.18 20:43

hijihyo
2022.01.25 15:36

호랭이띠
2022.01.31 20:09

done

acebed
2022.03.10 21:07

done

하랴랴
2022.03.15 15:54

done

kimgugu
2022.03.27 14:17

ChimChim
2022.03.29 23:51

Kdata
2022.05.02 14:22

krooner
2022.05.19 21:17

Y2J
2022.07.11 14:43

카르루알룰
2023.01.09 11:25

done

highllight
2023.02.02 13:52

김시옷
2023.05.25 00:24

done+