Python 튜토리얼

기초

  • moneyIcon Prize : 교육
  • 9,999명 D-100719

 

Lv4 전처리 9/9 python 파이썬 Polynomial Features (2)

2021.08.18 16:25 2,964 Views

이전 시간에 Polynomial Features 라이브러리에 대해 간략히 알아보았다면, 이번 시간에는 와인 품질 분류 데이터에 Polynomial Features를 적용해 보고 decision tree 모델을 이용해 품질 분류를 해보도록 하겠습니다.


실습 순서는 다음과 같습니다.


1. train 데이터 변환

2. 모델 학습 (Decision Tree)

3. test 데이터 변환

4. 추론

5. 정답 파일 생성


---------------------------------------------------------------------------------------------------------


 # train 데이터를 PolynomialFeatures 를 이용하여 변환

 

poly_features = PolynomialFeatures(degree=2# 차원은 2로 설정


# 와인 품질 기준인 quality 변수를 제외한 나머지 변수를 포함한 데이터 변환.

df = train.drop('quality',axis = 1)

df_poly = poly_features.fit_transform(df) # fit_transform 메소드를 통해 데이터 변환

df_poly = pd.DataFrame(df_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환


# DecisionTreeClassifier 모델을 변환된 train 데이터로 학습


from sklearn.tree import DecisionTreeClassifier


model = DecisionTreeClassifier()

model.fit(df_poly,train['quality'])


# test 데이터 변환


poly_features = PolynomialFeatures(degree=2# 차원은 2로 설정


test_poly = poly_features.fit_transform(test) # fit_transform 메소드를 통해 데이터 변환

test_poly = pd.DataFrame(test_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환


# 결괏값 추론

pred = model.predict(test_poly)


# 정답 파일 생성

submission = pd.read_csv('data/sample_submission.csv')

submission['quality'] = pred

submission.to_csv('poly.csv',index = False)


---------------------------------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #MinMaxScailing

로그인이 필요합니다
0 / 1000
그린티
2021.09.12 14:16

done

다욤
2021.09.20 01:44

done

Holte
2021.10.07 19:02

왼쪽눈썹왁싱
2021.11.01 18:54

changhyeon
2021.12.29 19:30

done

moran
2022.01.03 16:53

dbnoid
2022.01.19 07:15

hijihyo
2022.01.25 21:34

done

호랭이띠
2022.01.31 22:38

done

acebed
2022.03.10 21:08

done

하랴랴
2022.03.27 19:27

done

kimgugu
2022.03.28 13:23

Kdata
2022.05.02 15:04

krooner
2022.05.19 22:29

highllight
2023.02.02 22:58

김시옷
2023.05.28 15:51

done+

이전 글
인덱싱을 위한 Pandas .iloc .loc 사용 방법 데이터 분석 및 조작을위한
Competition - Python 튜토리얼
Likes 4
Views 1,707
Comments 0
일 년 전
현재 글
Lv4 전처리 9/9 python 파이썬 Polynomial Features (2)
Competition - Python 튜토리얼
Likes 10
Views 2,964
Comments 16
3년 전
다음 글
다음 글이 존재하지 않습니다.