Python 튜토리얼

기초

  • moneyIcon 상금 : 교육
  • 9,999명 D-100698

 

Lv4 전처리 복습 - (1) 🤗😏

2021.08.20 10:10 2,349 조회

다중 공선성 해결


다중 공선성을 해결 하는 방법은 크게 3가지가 있습니다.

  1. 변수 정규화
  2. 변수 제거
  3. PCA(주성분 분석)


변수 정규화

변수 정규화의 경우 Sklearn의 MinMaxScaler()를 통해 손 쉽게 적용 할 수 있습니다.


변수 제거

VIF(분산 팽창 요인) 계수가 10 이상인 변수들은 다중 공성성이 있다고 판단하여 제거 해줍니다.


PCA (주성분 분석)

PCA는 차원 축소의 방법 중 하나 인 feature extraction의 대표적인 기법 입니다.


*차원 축소 : 많은 피처로 구성된 다차원 데이터 셋의 차원을 축소해 새로운 차원의 데이터 셋을 생성하는 것

*feature extraction : 기존 피처를 단순 압축이 아닌, 함축적으로 더 잘 설명 할 수 있는 또 다른 공간으로 매핑 해 추출 하는 것


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv # 다중 공선성

로그인이 필요합니다
0 / 1000
Holte
2021.10.07 19:39

dbnoid
2022.01.19 07:17

acebed
2022.03.10 21:08

done

하랴랴
2022.03.27 19:42

done

Kdata
2022.05.02 15:10

krooner
2022.05.19 22:30

dirno
2022.07.14 15:42

highllight
2023.02.12 22:37

이전 글
인덱싱을 위한 Pandas .iloc .loc 사용 방법 데이터 분석 및 조작을위한
대회 - Python 튜토리얼
좋아요 4
조회 1,820
댓글 0
일 년 전
현재 글
Lv4 전처리 복습 - (1) 🤗😏
대회 - Python 튜토리얼
좋아요 8
조회 2,349
댓글 8
3년 전
다음 글
다음 글이 존재하지 않습니다.