분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv4 전처리 복습 - (2) 👸🤴
머신러닝 모델링을 하다 보면 제한된 변수로 성능을 끌어 올리는 데는 한계가 있습니다.
특히 정형 데이터의 경우 데이터 증강은 제한적입니다. 그래서 더욱더 효율적인 파생 변수를 추가하는 것이 중요합니다.
파생 변수를 가장 간단하게 추가하는 방법은 연속형 변수를 범주형 변수로 변환하는 방법이 있습니다.
두번째로는 sklearn의 Polynominal features라이브러리를 이용해 기존 변수를 다항식 형태로 변환 시키는 방법이 있습니다.
연속형 변수를 범주형 변수로 변환 시키는 방법은 여러가지가 있겠지만 그중 2가지에 대해 알아 보겠습니다.
특히 두 번째 pandas의 cut() 함수를 이용하면 손쉽게 연속형 변수를 범주형 변수로 변환 시킬 수 있습니다.
PolynomialFeatures라이브러리는 sklearn에 내장되어 있는 라이브러리 입니다.
이 라이브러리를 이용하면 현재 데이터를 다항식 형태로 변환 시킬 수 있습니다.
데이터에 x1,x2 변수가 있다 하면 PolynomialFeatures 라이브러리를 이용해
1, x1, x2, x1^2, x1*x2, x2^2 로 간단하게 변환 시킬 수 있습니다.
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv # 다중 공선성
✅
done
✅
✅
✅
✅
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅