분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv4 EDA 5/5 python 파이썬 다중공선성 VIF(분산 팽창 요인)
이번에는 변수의 다중공선성을 확인하는 방법 중 하나인 VIF(Variance Inflation Factors, 분산팽창요인)에대해 알아 보겠습니다. 👋
VIF는 변수간의 다중공선성을 진단하는 수치이며 범위 1부터 무한대입니다.
통계학에서는 VIF 값이 10이상이면 해당 변수가 다중공선성이 잇는 것으로 판단 합니다.
VIF를 구하는 수식은 VIFk = 1 / (1 - Rj2) 입니다.
여기서 VIFk 는 k번째 변수의 VIF 값을 의미하고, Rj2 는 회귀분석에서 사용하는 결정계수 입니다.
-----------------------------------------------------------------------------------------------------------------------------------------
# 결과값을 저장할 VIF라는 이름의 리스트 생성
vif = []
# values atribution(속성) 이용해 train 데이터의 값만 추출
train_val = train.values
# variance_inflation_factor 함수에 인자로 train_val (train 데이터의 값)과 인덱스 번호 지정
# for문 이용
for i in range(len(train.columns)):
vif.append(variance_inflation_factor(train_one.values, i))
vif
-----------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv
done
✅
✅
✅
✅
done
✅
✅
✅
✅
done
done
done
✅
✅
✅
✅
✅
Done
✅
done+
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
done