Python 튜토리얼

Lv4 전처리 8/9 python 파이썬 Polynomial Features (1)

2021.08.17 17:57 3,393 조회

이전 시간에는 연속형 데이터를 범주형 데이터로 변환 시키는 방법으로 변수를 추가했다면, 이번 시간과 다음 시간에는 Polynomial Features 라는 라이브러리를 이용해 파생 변수를 생성해보도록 하겠습니다. 🧨🧨

먼저 Polynomial Features라는 라이브러리에 대해 알아 보도록 하겠습니다.


PolynomialFeatures라이브러리는 sklearn에 내장되어 있는 라이브러리 입니다.  

이 라이브러리를 이용하면 현재 데이터를 다항식 형태로 변환 시킬 수 있습니다.


데이터에 x1,x2 변수가 있다 하면 PolynomialFeatures 라이브러리를 이용해

1, x1, x2, x1^2, x1*x2, x2^2 로 간단하게 변환 시킬 수 있습니다.

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

# 임의 데이터 생성


X = np.arange(6).reshape(32)


df =  pd.DataFrame(X)

df.columns = ['x_1','x_2']



poly_features = PolynomialFeatures(degree=2# 차원은 2로 설정

df_poly = poly_features.fit_transform(df) # fit_transform 메소드를 통해 데이터 변환

df_poly = pd.DataFrame(df_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환


df_poly.columns = ['1','x1','x2','x1^2','x1*x2','x2^2'# df_poly의 컬럼을 1,x1,x2,x1^2,x1*x2,x2^2 로 변경

df_poly

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #MinMaxScailing

로그인이 필요합니다
0 / 1000
그린티
2021.09.12 13:55

done

다욤
2021.09.20 01:24

done

Holte
2021.10.07 18:21

왼쪽눈썹왁싱
2021.11.01 18:51

changhyeon
2021.12.29 19:15

done

moran
2022.01.03 16:48

dbnoid
2022.01.19 07:07

hijihyo
2022.01.25 18:29

호랭이띠
2022.01.31 22:34

done

acebed
2022.03.10 21:07

done

kimgugu
2022.03.28 13:15

krooner
2022.05.19 22:18

khloee
2022.05.26 15:36

Y2J
2022.07.11 16:41

highllight
2023.02.02 15:51

김시옷
2023.05.28 15:41

done+