#오늘의 파이썬 #1일1오파 #파이썬 # python

매일 오전10시 업로드, Dacon Daily Python Camp. 1일1오파 격파하기!

  • moneyIcon Prize : 교육
  • 30Team D-101513

 

Lv4 전처리 9/9 python 파이썬 Polynomial Features (2)

2021.08.18 16:25 440 Views

이전 시간에 Polynomial Features 라이브러리에 대해 간략히 알아보았다면, 이번 시간에는 와인 품질 분류 데이터에 Polynomial Features를 적용해 보고 decision tree 모델을 이용해 품질 분류를 해보도록 하겠습니다.


실습 순서는 다음과 같습니다.


1. train 데이터 변환

2. 모델 학습 (Decision Tree)

3. test 데이터 변환

4. 추론

5. 정답 파일 생성


---------------------------------------------------------------------------------------------------------


 # train 데이터를 PolynomialFeatures 를 이용하여 변환

 

poly_features = PolynomialFeatures(degree=2# 차원은 2로 설정


# 와인 품질 기준인 quality 변수를 제외한 나머지 변수를 포함한 데이터 변환.

df = train.drop('quality',axis = 1)

df_poly = poly_features.fit_transform(df) # fit_transform 메소드를 통해 데이터 변환

df_poly = pd.DataFrame(df_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환


# DecisionTreeClassifier 모델을 변환된 train 데이터로 학습


from sklearn.tree import DecisionTreeClassifier


model = DecisionTreeClassifier()

model.fit(df_poly,train['quality'])


# test 데이터 변환


poly_features = PolynomialFeatures(degree=2# 차원은 2로 설정


test_poly = poly_features.fit_transform(test) # fit_transform 메소드를 통해 데이터 변환

test_poly = pd.DataFrame(test_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환


# 결괏값 추론

pred = model.predict(test_poly)


# 정답 파일 생성

submission = pd.read_csv('data/sample_submission.csv')

submission['quality'] = pred

submission.to_csv('poly.csv',index = False)


---------------------------------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #MinMaxScailing

그린티
2021.09.12 14:16

done

다욤
2021.09.20 01:44

done

Holte
2021.10.07 19:02

왼쪽눈썹왁싱
2021.11.01 18:54

changhyeon
2021.12.29 19:30

done

moran
2022.01.03 16:53

dbnoid
2022.01.19 07:15

hijihyo
2022.01.25 21:34

done

로그인이 필요합니다
0 / 1000