분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv4 전처리 5/9 python 파이썬 다중공선성 해결 - PCA (3)
안녕하세요 👩🌾👨🌾
이전 시간에는 PCA가 무엇인지 개념에 대해 배웠다면, 이번 시간에는 iris 데이터를 이용해 PCA 실습을 진행해보도록 하겠습니다.
실습 순서는 다음과 같습니다.
----------------------------------------------------------------------------------------------------------------------
#setosa는 빨간색, versicolor는 노란색, virginica는 파란색
color=['r', 'y', 'b']
# setosa의 target 값은 0, versicolor는 1, virginica는 2.
# 각 target 별로 다른 색으로 scatter plot
for i, c in enumerate(color):
x_axis_data = df[df['target']==i]['sepal_length']
y_axis_data = df[df['target']==i]['sepal_width']
plt.scatter(x_axis_data, y_axis_data,color = c,label=iris.target_names[i])
plt.legend()
plt.xlabel('sepal length')
plt.ylabel('sepal width')
plt.show()
# Target 값을 제외한 모든 속성 값을 MinMaxScaler를 이용하여 변환
# 'sepal_length','sepal_width','petal_length','petal_width'
df_features = df[['sepal_length','sepal_width','petal_length','petal_width']]
df_scaler = MinMaxScaler().fit_transform(df_features)
# PCA를 이용하여 4차원 변수를 2차원으로 변환
pca = PCA(n_components=2)
#fit( )과 transform( ) 을 호출하여 PCA 변환 / 데이터 반환
pca.fit(df_scaler)
df_pca = pca.transform(df_scaler)
print(df_pca.shape)
# PCA 변환된 데이터의 컬럼명을 각각 PCA_1, PCA_2로 지정
df_pca = pd.DataFrame(df_pca)
df_pca.columns = ['PCA_1','PCA_2']
df_pca['target']=df.target
df_pca.head(3)
#setosa는 빨간색, versicolor는 노란색, virginica는 파란색
color=['r', 'y', 'b']
# setosa의 target 값은 0, versicolor는 1, virginica는 2.
# 각 target 별로 다른 색으로 scatter plot
for i, c in enumerate(color):
x_axis_data = df_pca[df_pca['target']==i]['PCA_1']
y_axis_data = df_pca[df_pca['target']==i]['PCA_2']
plt.scatter(x_axis_data, y_axis_data, color = c,label=iris.target_names[i])
plt.legend()
plt.xlabel('PCA_1')
plt.ylabel('PCA_2')
plt.show()
----------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #MinMaxScailing
done
✅
✅
done
✅
✅
✅
done
done
✅
✅
✅
✅
✅
✅
✅
done+
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
done