분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Lv4 전처리 복습 - (2) 👸🤴
머신러닝 모델링을 하다 보면 제한된 변수로 성능을 끌어 올리는 데는 한계가 있습니다.
특히 정형 데이터의 경우 데이터 증강은 제한적입니다. 그래서 더욱더 효율적인 파생 변수를 추가하는 것이 중요합니다.
파생 변수를 가장 간단하게 추가하는 방법은 연속형 변수를 범주형 변수로 변환하는 방법이 있습니다.
두번째로는 sklearn의 Polynominal features라이브러리를 이용해 기존 변수를 다항식 형태로 변환 시키는 방법이 있습니다.
연속형 변수를 범주형 변수로 변환 시키는 방법은 여러가지가 있겠지만 그중 2가지에 대해 알아 보겠습니다.
특히 두 번째 pandas의 cut() 함수를 이용하면 손쉽게 연속형 변수를 범주형 변수로 변환 시킬 수 있습니다.
PolynomialFeatures라이브러리는 sklearn에 내장되어 있는 라이브러리 입니다.
이 라이브러리를 이용하면 현재 데이터를 다항식 형태로 변환 시킬 수 있습니다.
데이터에 x1,x2 변수가 있다 하면 PolynomialFeatures 라이브러리를 이용해
1, x1, x2, x1^2, x1*x2, x2^2 로 간단하게 변환 시킬 수 있습니다.
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv # 다중 공선성
✅
done
✅
✅
✅
✅
✅
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅