Lv4 전처리 9/9 python 파이썬 Polynomial Features (2)

Python 튜토리얼

2021.08.18 16:25 5,836 Views

이전 시간에 Polynomial Features 라이브러리에 대해 간략히 알아보았다면, 이번 시간에는 와인 품질 분류 데이터에 Polynomial Features를 적용해 보고 decision tree 모델을 이용해 품질 분류를 해보도록 하겠습니다.

실습 순서는 다음과 같습니다.

1. train 데이터 변환

2. 모델 학습 (Decision Tree)

3. test 데이터 변환

4. 추론

5. 정답 파일 생성

---------------------------------------------------------------------------------------------------------

# train 데이터를 PolynomialFeatures 를 이용하여 변환

poly_features = PolynomialFeatures(degree=2) # 차원은 2로 설정

# 와인 품질 기준인 quality 변수를 제외한 나머지 변수를 포함한 데이터 변환.

df = train.drop('quality',axis = 1)

df_poly = poly_features.fit_transform(df) # fit_transform 메소드를 통해 데이터 변환

df_poly = pd.DataFrame(df_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환

# DecisionTreeClassifier 모델을 변환된 train 데이터로 학습

from sklearn.tree import DecisionTreeClassifier

model = DecisionTreeClassifier()

model.fit(df_poly,train['quality'])

# test 데이터 변환

poly_features = PolynomialFeatures(degree=2) # 차원은 2로 설정

test_poly = poly_features.fit_transform(test) # fit_transform 메소드를 통해 데이터 변환

test_poly = pd.DataFrame(test_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환

# 결괏값 추론

pred = model.predict(test_poly)

# 정답 파일 생성

submission = pd.read_csv('data/sample_submission.csv')

submission['quality'] = pred

submission.to_csv('poly.csv',index = False)

---------------------------------------------------------------------------------------------------------

[Colab 실습 링크]

↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #MinMaxScailing

16 Comments

comment

0 / 1000

그린티

2021.09.12 14:16

done

다욤

2021.09.20 01:44

done

Holte

2021.10.07 19:02

✅

왼쪽눈썹왁싱

2021.11.01 18:54

✅

changhyeon

2021.12.29 19:30

done

moran

2022.01.03 16:53

✅

dbnoid

2022.01.19 07:15

✅

hijihyo

2022.01.25 21:34

done

호랭이띠

2022.01.31 22:38

done

acebed

2022.03.10 21:08

done

하랴랴

2022.03.27 19:27

done

kimgugu

2022.03.28 13:23

✅

Kdata

2022.05.02 15:04

✅

krooner

2022.05.19 22:29

✅

highllight

2023.02.02 22:58

✅

김시옷

2023.05.28 15:51

done+

📣 The comment input field has been moved to the top of the comment list!

List

Lv4 EDA 복습 🧓👴

Competition - Python 튜토리얼

Current

Lv4 전처리 9/9 python 파이썬 Polynomial Features (2)

Competition - Python 튜토리얼

Likes 10

Comments 16

5년 전

Lv4 전처리 8/9 python 파이썬 Polynomial Features (1)

Competition - Python 튜토리얼