Python 튜토리얼

Lv4 EDA 5/5 python 파이썬 다중공선성 VIF(분산 팽창 요인)

2021.08.06 14:54 7,155 Views

이번에는 변수의 다중공선성을 확인하는 방법 중 하나인 VIF(Variance Inflation Factors, 분산팽창요인)에대해 알아 보겠습니다. 👋


VIF는 변수간의 다중공선성을 진단하는 수치이며 범위 1부터 무한대입니다.

통계학에서는 VIF 값이 10이상이면 해당 변수가 다중공선성이 잇는 것으로 판단 합니다.


VIF를 구하는 수식은 VIF= 1 / (1 - Rj2) 입니다.

여기서 VIFk 는 k번째 변수의 VIF 값을 의미하고, Rj2 는 회귀분석에서 사용하는 결정계수 입니다.


-----------------------------------------------------------------------------------------------------------------------------------------

# 결과값을 저장할 VIF라는 이름의 리스트 생성

vif = []


# values atribution(속성) 이용해 train 데이터의 값만 추출

train_val = train.values


#  variance_inflation_factor 함수에 인자로 train_val (train 데이터의 값)과 인덱스 번호 지정  

# for문 이용

for i in range(len(train.columns)):

  vif.append(variance_inflation_factor(train_one.values, i))


vif

-----------------------------------------------------------------------------------------------------------------------------------------

[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv


로그인이 필요합니다
0 / 1000
그린티
2021.09.12 12:13

done

다욤
2021.09.19 16:31

done

찬찬이
2021.09.26 14:28

지내니
2021.09.29 20:42

Holte
2021.10.06 20:27

왼쪽눈썹왁싱
2021.11.01 16:18

changhyeon
2021.12.17 12:30

done

도톤
2022.01.02 20:23

moran
2022.01.03 15:57

dbnoid
2022.01.18 20:37

hijihyo
2022.01.25 15:01

호랭이띠
2022.01.31 19:56

done

acebed
2022.03.10 21:07

done

하랴랴
2022.03.15 14:49

done

ChimChim
2022.03.25 23:58

kimgugu
2022.03.27 13:25

Kdata
2022.04.29 16:00

krooner
2022.05.19 20:45

Y2J
2022.07.11 00:32

Wefe
2022.07.27 09:56

Done

highllight
2023.02.02 11:38

김시옷
2023.05.24 23:47

done+