#오늘의 파이썬 #1일1오파 #파이썬 # python

매일 오전10시 업로드, Dacon Daily Python Camp. 1일1오파 격파하기!

  • moneyIcon Prize : 교육
  • 30Team D-101520

 

Lv4 EDA 4/5 python 파이썬 다중공선성 Scatter plot

2021.08.06 12:02 586 Views

다중공선성

다중공선선은 상관관계가 높은 독립변수들이 동시에 모델에 포함될 때 발생합니다.

만약 두 변수가 완벽하게 다중공선성에 걸려있다면, 같은 변수를 두 번 넣은 것이므로 모델이 결괏값을 추론하는 데 방해가 될 수 있습니다.

 

CCKorea / CC BY


다중공선성 확인

다중공선성을 확인 하는 방법은 크게 3가지가 있습니다.

  1. Scatter plot을 통한 확인
  2. Heatmap 그래프를 통한 확인
  3. VIF(Variance Inflation Factors, 분산팽창요인)을 통한 확인

이번 시간에는 첫번째 방법인 Scatter plot을 이용하여 다중공선성을 확인 해보겠습니다.

Scatter Plot(산점도 그래프)는 두 개의 연속형 변수에 대한 관계를 파악하는데 유용하게 사용할 수 있습니다.

Scatter Plot 예시

CCKorea / CC BY


예시처럼 x 데이터가 증가함에 따라 y 데이터가 증가하는 경향을 보이는데, 이럴 경우 두 변수의 상관도가 높다고 해석 할 수 있습니다.

---------------------------------------------------------------------------------------------------------------------

# Scatter Plot을 그릴 변수 지정 (

x_data = train['residual sugar']

y_data = train['density']


# seaborn 의 scatterplot함수를 이용해 그래프를 그립니다.

sns.scatterplot(x = x_data, y = y_data )

---------------------------------------------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv

그린티
2021.09.12 11:59

done

다욤
2021.09.19 16:28

done

찬찬이
2021.09.26 14:00

Holte
2021.10.06 20:25

왼쪽눈썹왁싱
2021.11.01 16:07

changhyeon
2021.12.17 10:52

done

하잉바
2022.01.02 20:21

moran
2022.01.03 15:48

로그인이 필요합니다
0 / 1000